FreeMdict改版,欢迎提建议!

大辞海 原始JSON数据

汉语 hua 2个月前 (09-27) 579次浏览 已收录 15个评论 扫描二维码
文章目录[隐藏]

数据简介

大辞海原始数据,是JSON的,但是应该需要点奇技淫巧来读取,我记不得了,大概是我当初存数据的时候忘了加

json.dump

这一行了,嘻嘻。

反正数据给你们,不老是有人说我的大辞海做的不好看,排版不好,差差差吗,原始数据给你,你自己做吧。

注意事项

我尽量回忆一下,有哪些坑和注意事项。

  1. TXT 文件中一行一个词条。
  2. 图片的地址是不用登录就可以下载的,那个 PDF 网址也是。
  3. 里面的数据其实不太好看,有一个标签会反复出现很多次很多次很多次,记得消除掉。
  4. 记得合并词条!因为这是所有单独的词条,有的词会出现在很多个卷中。

就这些吧。

下载地址

记得右键点击另存为哦。

https://downloads.freemdict.com/Recommend/%E5%A4%A7%E8%BE%9E%E6%B5%B7_all_json.txt

另外,后会有期!

喜欢 (10)
头像
发表我的评论
取消评论

表情 贴图 加粗 删除线 居中 斜体 签到
(15)个小伙伴在吐槽
  1. 头像
    有的图片不显示,请问是原网站就没有吗?比如词条『0型语法』词条中{其重写规则是φ→ψ,φ≠}后面是一张图片,但是没有显示。
    匿名2019-10-22 13:41 回复 Windows 7 | Firefox浏览器 69.0
    • 头像
      是的 你自己看咯 你看那个网页有没有404
      hua2019-10-22 15:23 回复 Windows 10 | Chrome 77.0.3865.120
    • 头像
      是的,页面404。这样的话大部分图片(8千多张图片)都没有,挺可惜的,不知道网站是不是一直还在加图片。hua 兄的版本唯一遗憾的是没有把 PDF 图片链接利用起来,其实可以做一个到 PDF 图片的链接,以备在线查阅这些缺图片的词条。 另外,反馈一个问题:词条『』义项2中{见“行李}下面两行应该合并上来,估计还有其它地方还有相同的问题。
      匿名2019-10-22 16:43 回复 Windows 7 | Firefox浏览器 69.0
      • 头像
        有两千个图片是好的
        hua2019-10-22 19:18 回复 Linux | Chrome 77.0.3865.120
  2. 头像
    支持
    匿名2019-10-11 12:57 回复 Mac OS X | Safari浏览器 605.1.15
  3. 头像
    非常感谢hua大无私分享。处理了一下看了看,感觉这个百科还是不够详细。比方“鼻涕”这个词都没有,我都不知道为啥会想到这个词,随手一搜就没有。感觉现在中文百科可能确实百度条目最多了,但是质量堪忧。
    匿名2019-10-03 17:00 回复 Mac OS X | Chrome 77.0.3865.90
  4. 头像
    排版很不错啊。。。一直用,感谢😊
    匿名2019-09-30 15:28 回复 Linux | Chrome 68.0.3440.91
  5. 头像
    hua大,是否可以爬取下WordReference.com中的英汉词典,虽然中文解释不错,但其特点是英文词条下的英文解释非常简明,往往用一个简单的英文单词就能解释清楚单词的意思。
    匿名2019-09-29 20:15 回复 Linux | Safari浏览器 537.36
  6. 头像
    站长分享给大家的本来就够好了,发这原材料只有利于那些喜欢玩弄奇技淫巧的人,再说成品也可以解压出来啊。倒是希望能扒下《辞源》,那可是很窝囊的半成品都不见踪影。
    匿名2019-09-28 23:39 回复 Windows 10 | Firefox浏览器 61.0
    • 头像
      那个我试过了,反扒极其严格,我自己花了40买了三个月。他的反扒到什么地步呢,我正常浏览词条,网页都会加载不出来。如果你超过限制,那么就是封禁八个小时。这玩意是求之不得的。
      hua2019-09-29 07:28 回复 Linux | Chrome 77.0.3865.92
      • 头像
        相信站长成为超级黑客。没见有人秒破Iphone漏洞?又没见有人让ATM自动吐钞?年青人总会成长的。
        匿名2019-09-29 15:23 回复 Windows 10 | Firefox浏览器 61.0
  7. 头像
    文件大小1,713,520,422 字节。 md5:6335b59f85c067d237b37dbbc64dcd9b 下载完记得核对。
    匿名2019-09-28 11:15 回复 Windows 10 | Internet Explorer 7.0
    • 头像
      朋友能不能压缩一下,分享到蓝奏网盘上?先谢谢了!
      匿名2019-09-28 12:33 回复 Linux | Chrome 57.0.2987.132
  8. 头像
    这个文件到底多大啊,hua大神能不能压缩一下啊?下了快一早上了,经常中断,得重新下载。
    匿名2019-09-28 09:41 回复 Windows 7 | Chrome 77.0.3865.90
  9. 头像
    感謝,已轉成docx檔
    匿名2019-09-28 01:08 回复 Mac OS X | Safari浏览器 604.1