常见问题解答
bitmagnet 会下载或分发任何非法或侵犯版权的内容吗?
不会。bitmagnet 完全不会下载、存储或分发任何内容。它只会下载内容的元数据。不过,它可能会下载关于非法或侵权内容的元数据,因此用户在将磁力链接添加到自己的 BitTorrent 客户端时应谨慎操作。bitmagnet 会尝试检测并过滤有害内容(如CSAM),以避免用户的索引中出现这些不良元数据。
使用 bitmagnet 时需要使用 VPN 吗?
建议使用 VPN:bitmagnet 可能会下载关于非法或受版权保护内容的元数据。某些执法或反盗版追踪工具可能会误判此类行为,尽管我们尚未听说有人因使用本软件或类似元数据爬虫而遇到麻烦。VPN 设置简单且价格低廉,安全总比后悔好。我们与任何 VPN 服务商无关,但如果你不确定选择哪家,可以考虑 Mullvad 和 ProtonVPN。
bitmagnet 适合用作公共服务吗?
不适合,它是为自托管设计的。UI 和 API 允许执行破坏性操作,且未经过安全性或可扩展性审查,因此不建议作为公共服务使用。虽然暴露了 API,理论上可以用来构建公共服务,但本项目不会以此为主要目标。
bitmagnet 的系统要求是什么?
大致建议为 BitMagnet 分配约 300MB 内存,Postgres 数据库至少 1GB 内存。每 1,000 万个种子文件大约需要 80GB 磁盘空间,这足以支持几个月的爬取,但最终爬取的种子数量没有上限。数据库在拥有充足内存和快速磁盘(最好是 SSD)时运行最快。
我第一次启动 bitmagnet 没有马上看到种子,是不是哪里出问题了?
如果一切正常,bitmagnet 应该会在最多 10 分钟内(缓存 TTL)在 Web UI 中显示种子。种子列表顶部的刷新按钮可以强制刷新缓存,实时查看新内容。请注意,种子插入数据库后,需要后台队列任务运行后才能在 UI 中显示。如果你导入了成千上万个种子,全部显示出来可能需要一段时间。如果仍未看到种子,请查看下一个问题。
bitmagnet 找不到新种子,怎么回事?
重要提示
bitmagnet 在 Linux 和 MacOS 上运行良好;如果在这些平台上无法找到新种子,通常是配置问题,而不是软件 bug。
有 Windows 用户报告过相关问题:如果你在 Windows 上遇到问题,建议暂时在 Linux 或 MacOS 上运行本软件。
bitmagnet 现在会在主工具栏显示健康状态:健康时显示对勾,不健康时显示叉号,有时会显示三个点表示待定。点击可打开健康对话框,检查所有 worker 是否正常运行。
最常见的问题是网络、防火墙或 VPN 配置错误,导致 bitmagnet 无法连接到 DHT。此外,TMDB API 在某些国家被屏蔽;如遇此情况,可通过 tmdb.enabled
配置项禁用 TMDB 集成,或使用 VPN。配置个人 TMDB API 密钥(或禁用 TMDB)会让队列运行更快。
可通过仪表盘监控队列吞吐量。队列仪表盘上,以下情况表明存在问题:
- 待处理任务数量很高,已处理任务数长时间未增加
- 失败任务数量很高
- 长时间没有新任务生成
为什么 bitmagnet 没有精确显示已索引的种子数量?
种子索引在 Postgres 数据库中,而 Postgres 在统计大量行时速度很慢。为保证性能,bitmagnet 采用了“预算计数”策略。它利用 Postgres 查询规划器提供的估算值和查询成本。如果成本超出预算,则返回估算值,UI 会显示 ~
估算符号;如果成本在预算内,则返回精确计数。对于大型结果集,通常只能看到估算值。
bitmagnet 从 DHT 爬取种子的速度是多少?
这取决于硬件、网络状况和 dht_crawler.scaling_factor
配置。通常每分钟可爬取 100 到 1,000 个种子。随着索引规模增大,爬取速度可能变慢,因为新发现的种子更可能已存在于索引中。
如何查看本次会话中 bitmagnet 爬取的种子总数?
新仪表盘可显示爬虫和任务队列的吞吐量。或者访问 /metrics
端点,查看指标 bitmagnet_dht_crawler_persisted_total
。{entity="Torrent"}
表示新爬取的种子,{entity="TorrentsTorrentSource"}
表示重新发现并更新了做种/下载数和最后发现时间的种子。
bitmagnet 如何确定 DHT 爬取种子的做种/下载数?
DHT 爬虫使用 BEP33 scrape 请求 来粗略估算当前的做种/下载数。
如何判断 bitmagnet 爬取的种子是否有人做种,能否下载?
简短的答案是无法确定。唯一的办法是将 info hash 添加到 BitTorrent 客户端。做种/下载数只能作为种子健康度的不完美参考。未来 bitmagnet 可能会提供“去中心化 tracker”等功能以改善这一点。
可以让 bitmagnet 的 DHT 爬虫爬取指定的 hash 吗?
不能。DHT 爬虫通过从网络中随机采样 info hash 工作,无法定位指定 hash——它只能爬取偶然发现的内容。你可以通过 导入 /import
端点 导入特定种子,未来可能会增加其他(独立于 DHT 爬虫的)方法。
为什么有很多种子被归为“未知”类别,明明它们有明确的内容类型?
bitmagnet 仍处于早期开发阶段,分类器会持续改进。新版本发布后,你可以按照重新分类教程重新分类种子。如果你想改进或自定义分类器,也是可以的。
如何让 bitmagnet 自动删除我不感兴趣的种子?
更好的问题是:为什么要删除?bitmagnet 所需的磁盘空间很便宜,搜索比删除更方便。不过这是最常见的问题之一,可以通过自定义分类器实现自动删除。请考虑删除已爬取内容会造成资源浪费和网络负担。分类器也并不完美:比如启用删除 XXX 内容,也会删除被误判为 XXX 的内容,导致你以后无法找到它们——比如因为包含了敏感词。如果你删除了很大比例的内容,说明你删除得太多了,建议直接使用现有的索引站点。
可以运行多个 bitmagnet 实例连接同一个数据库吗?
可以,只需让多个实例指向同一个数据库即可——但这会增加数据库负载,导致应用变慢。另一种方式是运行多个实例和多个数据库,定期合并数据库。