Show HN: Self-host Reddit – 2.38B posts, works offline, yours forever
产品/方法概述
- 一句话介绍: 一个支持完全离线运行、包含23.8亿条历史数据的自托管Reddit归档浏览器与AI知识库接口。
- 核心问题: 解决了Reddit API收费后历史数据获取难、第三方应用关停、以及高质量社区知识被平台垄断或被用户恶意删除导致的“互联网记忆丧失”问题。
- 实现方式: 通过处理Pushshift等PB级BT种子数据,利用Python和PostgreSQL将压缩包转为静态HTML或带API的数据库,并集成MCP服务器供AI调用。