Board logo

标题: [文本处理] 【已解决】如何用批处理把文本中的数据换个格式? [打印本页]

作者: tommytangtang    时间: 2014-8-13 20:27     标题: 【已解决】如何用批处理把文本中的数据换个格式?

本帖最后由 tommytangtang 于 2014-8-13 21:11 编辑

有如下格式的文本,数字分隔符为空格。当然数据不止三行
621.9 583.053 8.9
622.0 692.578 3.7
622.2 693.253 4.6
怎么样把这个文本里面的数据每行前面加个数字(从1开始,每行数字加1)和两个逗号,然后把分隔符都变成逗号呢,最后结果是这样的
1,,621.9,583.053,8.9
2,,622.0,692.578,3.7
3,,622.2,693.253,4.6
当然用excel表格也可以做得出来,但是麻烦,用批处理怎么做呢?
作者: CrLf    时间: 2014-8-13 20:41

本帖最后由 CrLf 于 2014-8-13 23:32 编辑
  1. @echo off&setlocal enabledelayedexpansion
  2. (for /f "delims=" %%a in (a.txt) do (
  3. set /a n+=1
  4. set "str=%%~a"
  5. echo !n!,,!str: =,!
  6. ))>b.txt
复制代码

作者: tommytangtang    时间: 2014-8-13 20:53

正在测试,文本一共有33M大小,看着新生成的文本在逐渐变大

顺便问下你们回复的贴子里,那个“复制代码”,我复制之后粘贴感觉bat命令都变成一行了
每个行分割的时候文本里面显示的是一个黑色方块
作者: tommytangtang    时间: 2014-8-13 21:06

原来一共有125万多行。。。
总算运行完了,问题已经解决了,谢谢Ctrl
正在看“[系列教程]批处理for语句从入门到精通”这个帖子,希望能尽快把Ctrl的语句全部读懂,自己可以随意转换文本里面的数据格式~~~  for 好强大!
还有,运行的时候怎样不显示cmd窗口呢。。。
作者: Batcher    时间: 2014-8-13 21:36

回复 3# tommytangtang


    换个浏览器试试呢
作者: tommytangtang    时间: 2014-8-13 23:17

回复 5# Batcher


    不是浏览器,是复制到文本中间后,文本显示黑色的方块代替的回车


刚刚自学了一下for语句,把Ctrl给的代码换了一下,结果是一样的,他的代码有几句没看懂
【set "str=%%~a"
echo !n!,,!str: =,!】

这个是我自己改的
@echo off
(for /f "tokens=1,2,3" %%i in (1.txt) do (
set /a n+=1
setlocal enabledelayedexpansion
echo !n!,,%%i,%%j,%%k
))>1.dat
我这个和Ctrl的哪个好用呢?虽然我这个一直在报错,但是感觉运行速度快一些呢,同样120多万行
作者: CrLf    时间: 2014-8-13 23:31

回复 5# Batcher


建议把 /forumdata/cache/common.js 中 function setCopy(text, msg) 函数最后一句
  1. clipboardswfdata = text;
复制代码
改成
  1. clipboardswfdata = BROWSER.chrome ? text.replace(/\n/g,'\r\n') : text;
复制代码

作者: tommytangtang    时间: 2014-8-13 23:34

刚刚试过了,我自己改的在倒数第二行加上“endlocal”后运行需要十多分钟,
不加“endlocal”虽然他一直报错,但是只要5分钟就搞定了,原数据同样是125万行
谁能解答一下。。。
作者: CrLf    时间: 2014-8-13 23:38

本帖最后由 CrLf 于 2014-8-13 23:39 编辑

回复 6# tommytangtang


    解释如下
  1. set "str=%%~a"
  2. ::设置 str 为行内容
  3. echo !n!,,!str: =,!
  4. ::输出 [行号],,[str空格替换为,后的内容]
复制代码
用 tokens 也行,但 endlocal 需要和 setlocal 对应使用,因为 setlocal 最多只能有 32 层,超过就会报错
忽然发现顶楼文本都是数字,所以 setlocal 就无需放到循环内了,代码已修改,应该快多了
要想更快,推荐用 gawk,专业的文本处理工具:
  1. @gawk -v flag=, "{print NR flag flag $1 flag $2 flag $3}" 1.txt>2.txt
复制代码

作者: Batcher    时间: 2014-8-13 23:46

回复 6# tommytangtang


    我的意思就是让你换个浏览器试试能否解决这个问题
作者: tommytangtang    时间: 2014-8-13 23:51

回复 9# CrLf


        果然很快,刚刚只用了80多秒就处理完了,非常感谢!

gawk我试试先
作者: CrLf    时间: 2014-8-13 23:58

本帖最后由 CrLf 于 2014-8-14 00:00 编辑

回复 11# tommytangtang


    每次 setlocal 都会备份一个新的变量表,大概是因为这个原因所以明显慢了
    最多可以备份 31 张变量表,用 endlocal 可以注销最近的那个
    每个 cmd.exe 和 call :Function 都独享 32 张表空间,退出进程或函数调用时会自动 endlocal
作者: tommytangtang    时间: 2014-8-14 00:03

回复 10# Batcher


    确实是浏览器的原因,用的360.换成ie就没问题了


回复 12# CrLf

好像懂了,初学,呵呵

用gawk还需要另外安装的?
作者: CrLf    时间: 2014-8-14 00:15

回复 13# tommytangtang


    下载了扔到 system32 或者脚本所在路径即可:http://bbs.bathome.net/viewthread.php?tid=3981
    相信我,你不会后悔下载 gawk 的
作者: tommytangtang    时间: 2014-8-14 00:27

回复  tommytangtang


    下载了扔到 system32 或者脚本所在路径即可:
    相信我,你不会后悔下载 ...
CrLf 发表于 2014-8-14 00:15



刚刚把他扔到system32了,然后试了一下,几乎是秒生成啊,太厉害了!!!
我要是想用vb编程然后在别的电脑上用,可以操作吗

当然,别的电脑是没有装gawk的电脑
作者: terse    时间: 2014-8-14 00:59

这里的 sed  效率跟不上 不贴出了
  1. gawk -vOFS="," "{$1=$1;print NR OFS OFS $0}" a.txt >b.txt
复制代码

作者: tommytangtang    时间: 2014-8-14 01:13

回复 16# terse


    没看懂。。。




欢迎光临 批处理之家 (http://bathome.net./) Powered by Discuz! 7.2