The most comprehensive database of Chinese poetry 🧶最全中华古诗词数据库, 唐宋两朝近一万四千古诗人, 接近5.5万首唐诗加26万宋诗. 两宋时期1564位词人,21050首词。
Go to file
2024-07-08 11:24:12 +08:00
.github Create test.yml 2020-11-06 17:29:13 +08:00
images 修改统计图字体 2018-09-03 16:29:48 +08:00
loader exclude error folder 2024-06-24 16:49:12 -07:00
rank Merge pull request #157 from xinglie/strain 2019-10-10 14:46:19 +08:00
strains add id 2019-10-10 14:42:09 +08:00
五代诗词 字和标点修正 2023-10-11 01:38:05 +08:00
元曲 修改为中文目录 2023-04-17 14:13:23 +08:00
全唐诗 字和标点修正 2023-10-11 01:38:05 +08:00
四书五经 修改为中文目录 2023-04-17 14:13:23 +08:00
宋词 字和标点修正 2023-10-11 01:38:05 +08:00
幽梦影 修改为中文目录 2023-04-17 14:13:23 +08:00
御定全唐詩 修改为中文目录 2023-04-17 14:13:23 +08:00
曹操诗集 字和标点修正 2023-10-11 01:38:05 +08:00
楚辞 修改为中文目录 2023-04-17 14:13:23 +08:00
水墨唐诗 fix(水墨唐诗): 修复田家行的内容缺失 2023-11-25 12:10:11 +00:00
纳兰性德 字和标点修正 2023-10-11 01:38:05 +08:00
蒙学 修改为中文目录 2023-04-17 14:13:23 +08:00
论语 修改为中文目录 2023-04-17 14:13:23 +08:00
诗经 修改为中文目录 2023-04-17 14:13:23 +08:00
_config.yml Set theme jekyll-theme-tactile 2018-01-15 14:33:57 +08:00
.gitignore update ignore 2023-04-17 14:15:09 +08:00
.travis.yml travis: remove py2.7 and use py3.7 2020-01-14 16:03:41 +08:00
LICENSE [ADD] License 2017-06-06 13:48:03 +08:00
log.log 修改为中文目录 2023-04-17 14:13:23 +08:00
README.md Update README.md 2024-07-08 11:24:12 +08:00
requirements.txt chore: pytest==5.3.2 2020-01-14 16:05:50 +08:00
test_poetry.py 修改为中文目录 2023-04-17 14:13:23 +08:00

chinese-poetry

chinese-poetry: 最全中文诗歌古典文集数据库

Build Status License Contributors Patreon

最全的中华古典文集数据库,包含 5.5 万首唐诗、26 万首宋诗、2.1 万首宋词和其他古典文集。诗人包括唐宋两朝近 1.4 万古诗人,和两宋时期 1.5 千古词人。数据来源于互联网。

为什么要做这个仓库? 古诗是中华民族乃至全世界的瑰宝,我们应该传承下去,虽然有古典文集,但大多数人并没有拥有这些书籍。从某种意义上来说,这些庞大的文集离我们是有一定距离的。而电子版方便拷贝,所以此开源数据库诞生了。此数据库通过 JSON 格式分发,可以让你很方便的开始你的项目。

古诗采集没有记录过程因为古诗数据庞大目标网站有限制采集过程经常中断超过了一个星期。2017 年新加入全宋词,全宋词爬取过程及数据分析

高频词分析图

宋词受欢迎的词牌名
两宋喜欢的词牌名
宋词高频词 宋词高频词
宋词作者作品榜 宋词作者作品榜
唐诗高频词 唐诗高频词
唐诗作者作品榜 唐诗作者作品榜
宋诗高频词 宋诗高频词
宋诗作者作品榜 宋诗作者作品榜

数据集

贡献

本项目目的是借助技术来生成格式化(JSON)数据,让开发者更方便快速的构建诗词类应用程序。身单力薄,欢迎更多人来维护,你可以通过以下方法来参与贡献:

  • 直接提交 PR 或者通过 issue 讨论来优化完善此数据库,理论上古诗歌体非宗教类都欢迎加入,部分有争议性的数据需要社区投票讨论决定是否加入。关于诗句的纠错在创建 PR 时请标明出处。更多规范请参考贡献规范文档

  • 如果你没有办法直接参与完善的过程,你也可以通过 「爱发电赞助」 「Patreon 周期性赞助」 的形式来持续帮助并激励我去优化完善此数据库。如果您不喜欢周期性赞助,你也可以通过「支付宝」或者「微信赞赏码」进行一次性赞助(备注留下邮箱)。

  • 如有建议或吐槽,欢迎联系我的邮箱 gaojunqi@outlook.com。

无论通过哪种形式贡献最终都会使之变得更好!

赞助者

贡献者

Contributors

案例展示

案例展示

Star History

Star History Chart

License

MIT 许可证。