Rank: 1

帖子: 6
积分: 18
技术: 0
捐助: 0
注册时间: 2018-11-22

1楼 跳转到 » 倒序看帖

字体大小: tT

发表于 2018-11-22 10:41 | 只看该作者

20元求批处理提取2.txt在1.txt中没有的行

报酬20元人民币
提取2txt在1txt中没有的行
手上有个能用的，但是速度太慢了，我有几百万数据需要处理
微信付款：18971801994

这有个示例：

@echo off
cls
echo.
echo.
echo                            比较文本提取不重复
echo,
echo        如有:1.txt 2.txt，提取2.txt在1.txt里没有的行
echo        文本2.txt应当比1.txt多一些内容。
echo        重复的不要
echo.
set /p wb1=请输入要处理的[路径]文本2: 
set /p wb2=请输入要处理的[路径]文本1: 
set /p wb3=请输入处理后生成的[路径]文本:
for /f "delims=" %%c in (%wb1%) do (
findstr "%%c" %wb2%>nul ||echo %%c>>%wb3%)
echo 处理完成
ping /n 2 127.0.1 >nul
goto :eof
复制代码

741474719

列兵

Rank: 1

帖子: 6
积分: 18
技术: 0
捐助: 0
注册时间: 2018-11-22

2楼

发表于 2018-11-22 11:28 | 只看该作者

已处理，各位老铁

TOP

Batcher

管理员

Rank: 12

帖子: 14933
积分: 46140
技术: 857
捐助: 745
注册时间: 2008-6-9

3楼

发表于 2018-11-22 11:56 | 只看该作者

回复 2# 741474719

代码发出来给大家分享一下吧，看看是否可以进一步优化。

我帮忙写的代码不需要付钱。如果一定要给，请在微信群或QQ群发给大家吧。
【微信公众号、微信群、QQ群】http://bbs.bathome.net/thread-3473-1-1.html
【支持批处理之家，加入VIP会员！】http://bbs.bathome.net/thread-67716-1-1.html

TOP

741474719

列兵

Rank: 1

帖子: 6
积分: 18
技术: 0
捐助: 0
注册时间: 2018-11-22

4楼

发表于 2018-11-22 17:32 | 只看该作者

回复 3# Batcher

@echo off
cd /d "%~dp0"
set  wb1=1.txt
set  wb2=2.txt
set  wb3=3.txt
powershell ^
$dict=New-Object 'System.Collections.Generic.Dictionary[[string],[int]]';^
$text1=[IO.File]::ReadAllText('%wb1%', [Text.Encoding]:

efault).split(\"`r`n\",[StringSplitOptions]::RemoveEmptyEntries);^
$text2=[IO.File]::ReadAllText('%wb2%', [Text.Encoding]::Default).split(\"`r`n\",[StringSplitOptions]::RemoveEmptyEntries);^
$fs=New-Object System.IO.FileStream('%wb3%', [System.IO.FileMode]::Create);^
$sw=New-Object System.IO.StreamWriter($fs, [Text.Encoding]::Default);^
for($i=0;$i -lt $text1.length;$i++){^
      if(-not $dict.ContainsKey($text1[$i])){^
         $dict.add($text1[$i],1);^
      };^
};^
for($i=0;$i -lt $text2.length;$i++){^
      if(-not $dict.ContainsKey($text2[$i])){^
         $sw.WriteLine($text2[$i]);^
      };^
};^
$sw.Flush();^
$sw.Close();^
$fs.Close();^
$sw.Dispose();^
$fs.Dispose();
pause

TOP

741474719

列兵

Rank: 1

帖子: 6
积分: 18
技术: 0
捐助: 0
注册时间: 2018-11-22

5楼

发表于 2018-11-22 17:33 | 只看该作者

@echo off
cls
echo.
echo.
echo                         比较文本提取不重复
echo,
echo       如有:1.txt 2.txt，提取2.txt在1.txt里没有的行
echo       文本2.txt应当比1.txt多一些内容。
echo       重复的不要
echo.
set /p wb1=请输入要处理的[路径]文本2:
set /p wb2=请输入要处理的[路径]文本1:
set /p wb3=请输入处理后生成的[路径]文本:
for /f "delims=" %%c in (%wb1%) do (
findstr "%%c" %wb2%>nul ||echo %%c>>%wb3%)
echo 处理完成
ping /n 2 127.0.1 >nul
goto :eof

TOP

741474719

列兵

Rank: 1

帖子: 6
积分: 18
技术: 0
捐助: 0
注册时间: 2018-11-22

6楼

发表于 2018-11-22 17:34 | 只看该作者

屌的一比，牛逼牛逼

TOP

flashercs

少校

Rank: 6 Rank: 6

帖子: 1244
积分: 2204
技术: 277
捐助: 0
注册时间: 2017-3-20

7楼

发表于 2018-11-22 18:57 | 只看该作者

本帖最后由 flashercs 于 2018-11-22 19:07 编辑

楼主最好把时间对比发出来,看看差距多少?

@echo off
cls
echo.
echo.
echo                            比较文本提取不重复
echo,
echo        如有:1.txt 2.txt，提取2.txt在1.txt里没有的行
echo        文本2.txt应当比1.txt多一些内容。
echo        重复的不要
echo.
set /p wb1=请输入要处理的[路径]文本2: 
set /p wb2=请输入要处理的[路径]文本1: 
set /p wb3=请输入处理后生成的[路径]文本:
findstr /livg:"%wb1%" "%wb2">"%wb3%
echo 处理完成
ping /n 2 127.0.1 >nul
goto :eof
复制代码

TOP

WHY

上校

Rank: 6 Rank: 6

帖子: 1482
积分: 3266
技术: 567
捐助: 0
注册时间: 2015-7-19

8楼

发表于 2018-11-22 19:28 | 只看该作者

gawk "FNR==NR{a[$0]=1}; FNR<NR && !a[$0]{print}" 1.txt 2.txt > 3.txt
复制代码

TOP

返回列表

[新手上路]批处理新手入门导读	[视频教程]批处理基础视频教程	[视频教程]VBS基础视频教程	[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动	[批处理精品]CMD命令50条不能说的秘密	[在线下载]第三方命令行工具	[在线帮助]VBScript / JScript 在线参考

20元求批处理提取2.txt在1.txt中没有的行

[收藏此主题] [关注此主题的新回复]

[通过 QQ、MSN 分享给朋友]