全球主机交流论坛

标题: 怎么分割txt文件 [打印本页]

作者: nut    时间: 2024-3-29 18:49
标题: 怎么分割txt文件
本帖最后由 nut 于 2024-3-29 18:51 编辑


一个大文件,按第一章第二章。。。。进行分割。

linux




IDC.WIKIRackNerd高性价比小鸡:1c1g14g2T$11.38/year(推荐)搬瓦吧 CC哥HOSTHATCH1c1g20g 20T
作者: yrj    时间: 2024-3-29 18:55
会哪个语言就写个脚本,根据规则切一下,要是啥都不会,就等个bash脚本大佬爱的供养
作者: kjj98709    时间: 2024-3-29 19:04
让chatgpt帮你写脚本
作者: mylove1    时间: 2024-3-29 19:09
这简单,找个gpt把文件扔给他,然后问他脚本怎么写就行了


作者: karson    时间: 2024-3-29 19:12
我猜你是在分割txt小说
我做过这种蠢事,如果是批量处理 这玩意比你想象中的更难

因为那东西是踏马纯人工制作的txt,所以没有固定的第一章、第二章分隔符,每个txt™都可能有自己的规矩

所以写不出统一的、绝对正确的脚本可以干这个事
作者: haode    时间: 2024-3-29 19:49
karson 发表于 2024-3-29 19:12
我猜你是在分割txt小说
我做过这种蠢事,如果是批量处理 这玩意比你想象中的更难

如果有固定的章节目录是可以的。
比如第一章,第二章这样。

作者: karson    时间: 2024-3-29 21:09
haode 发表于 2024-3-29 19:49
如果有固定的章节目录是可以的。
比如第一章,第二章这样。

如果是严格按照这个分的,就用这个写个正则匹配作为区分就好了

第(.+?)章
作者: 馒头爱大米    时间: 2024-3-29 21:14
有个软件,textformat挺好用的,专业用语小说和网文处理
吾爱有
作者: yaren    时间: 2024-3-29 21:35
split命令:
举例
        split -l 1600000 ksql.txt -d -a 2 go_
作者: inighty    时间: 2024-3-29 22:41
^\s*(第([0-9]|零|一|两|二|三|四|五|六|七|八|九|十|百|千|\s)+([章卷话]).*)


拿去用吧




欢迎光临 全球主机交流论坛 (https://www.91ai.net/) Powered by Discuz! X3.4