- 帖子
- 40
- 积分
- 147
- 技术
- 0
- 捐助
- 0
- 注册时间
- 2009-11-29
|
[文本处理] 小复杂 随机提取TXT中几行组成新的句子输出 不知道BAT能否实现
我有一个TXT文本 里面有10万个左右的短语 每行一个 短语长度不固定
一、按一个或多个关键词随机提取多个(具体数量可控制)这个TXT里面含有我指定的这一个或多个关键词的短
语组成一句话
-----比如我设定随机提取3-5个含有“作文”这个词的短语组成一句话,随机调用的短语之间用分隔符隔开,
分隔符可自己设置,总共生成100条 这个也是可设置的 最终实现的效果类似这样 作文代写-高考作文代写-专
业代写作文
二、由于那些短语字数不固定 所以我要求可以控制最终组成的这句话的数量
-----比如我设定此次限制为最低25个字,最高30个字,如果实际调用短语1+短语2+短语3的字数只要在25-30个
字之间都可以,否则就重新生成
三、由于数据比较大 十万行左右 随意性要求随机智能一些 不要老是在一个范围内提取
四、要求将按以上条件组合的结果导出为新的TXT格式 |
|