全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

CeraNetworks网络延迟测速工具IP归属甄别会员请立即修改密码
查看: 5046|回复: 39
打印 上一主题 下一主题

[经验] 超轻量tg中文搜索增强Bot | v0.1.0正式版

  [复制链接]
跳转到指定楼层
1#
发表于 2022-7-31 15:59:53 | 显示全部楼层 回帖奖励 |倒序浏览 |阅读模式
本帖最后由 xiao 于 2022-8-3 22:07 编辑

很久没来loc了,来了就是打广告
众所周知,tg的中文搜索十分拉跨(英文也是),本地索引增强搜索体验是很自然的想法。
调研过相关的项目,要么是搜索引擎太重,要么就正则/数据库硬搜。干脆自己写个算了,主打的就是轻量、跨平台、单文件启动。

GitHub: https://github.com/iyear/searchx

欢迎star~

特性
  • 最小化配置 & 单文件一键启动
  • 组件化扩展设计,可选多种存储后端
  • 跨平台支持 macOS/Windows/Linux
  • 特别为中文优化的搜索引擎
  • 大文件历史消息导入
  • 自定义国际化消息模板
  • ……


具体直接看GitHub吧 现在还在初版beta阶段,搜索结果界面什么的都还大有优化的空间。
------------------------
2022.8.3
已发布v0.1.0正式版: https://github.com/iyear/searchx/releases/tag/v0.1.0

相比v0.1.0-beta
优化了索引。
修复source命令不能导入匿名用户
修复转义问题,但还未完美解决

Road Map
下个版本将是一个破坏性更新,现有的部分命令将成为 searchx bot 的子命令。同时,将开发userbot相关功能,命令为 searchx user。

两者的区别为:
bot用于群主/频道主为群员搭建,搭建速度快,无封号风险。
user用于个人用户为自己的信息建立索引,方便个人搜索,但搭建速度较慢且可能存在封号风险。
2#
 楼主| 发表于 2022-7-31 16:36:09 | 显示全部楼层
伊若 发表于 2022-7-31 16:12
羡慕会写本子的大佬

神仙大佬来顶贴
3#
 楼主| 发表于 2022-7-31 17:08:46 | 显示全部楼层
myoppo 发表于 2022-7-31 16:37
还有英文  README.md

羡慕技术大佬

deepl一把梭,自己哪写得出
4#
 楼主| 发表于 2022-7-31 20:07:41 | 显示全部楼层
你们男生好厉害 发表于 2022-7-31 18:00
楼主弄个usrbot吧,想搜的群又不都是管理

想了一下这个确实比较有用。后续会加吧
5#
 楼主| 发表于 2022-7-31 20:09:21 | 显示全部楼层
匿名者 发表于 2022-7-31 19:21
“抱歉,您不是此对话的成员,您无法访问此消息”

搜出来了

demo基于E5SubBot交流群,需要先加入群组。看README
6#
 楼主| 发表于 2022-7-31 20:13:33 | 显示全部楼层
嗷嗷 发表于 2022-7-31 20:11
既然是为了增强中文搜索,基本是面向国人吧,为什么还要英文issue,

在中文社区宣传中文搜索,在英文社区宣传英文搜索
但出现的问题很可能是一致的,为了方便社区共同讨论,提倡使用英文提issue。
8#
 楼主| 发表于 2022-7-31 22:38:02 | 显示全部楼层

文件如果携带了标题,标题会被索引的。但是导入历史消息还未支持导出文字以外的消息(主要因为文件导出太慢了)

文件名本身还没有加入索引,已经加入正式版TODO
9#
 楼主| 发表于 2022-8-1 10:13:12 | 显示全部楼层
后续userbot和bot应该会在同一个项目里做。使用者根据需求切换
10#
 楼主| 发表于 2022-8-1 12:55:50 | 显示全部楼层
ojcc 发表于 2022-8-1 11:49
如果搜索结果输出能做到可视化界面就好了

后续会做更强大的网页搜索的,难度也不大的。不过目前还是专注于bot内搜索,有任何ui上的意见都可以提issue或者pr的
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2024-6-11 11:55 , Processed in 0.065646 second(s), 9 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表