Japanese Education Vocabulary
词典

5,467次阅读
11 条评论

经过两个星期或者三个星期的咕咕咕,这本词典总算做出来了,咕咕咕的主要原因是,日语词汇的词头处理。事实上大体部分在一个星期之前就已经完成。

使用过后还有建议或者意见,欢迎评论指出。

存在的问题:

1 旧日本語能力試験出題基準レベル:記載なし 这个缺了一个冒号 (CDプレーヤー)

2 间距问题 css我已经修复

继续等待问题,在下一个版本更新。

这本词典完全是由 FreeMdict Hua 制作,并在 FreeMdict 公开无权限首发。欢迎任何网站转载文章,并且不设任何权限和回复可见,并留下出处。

众人拾柴火焰高。

我说的

鄙人并不会日语,得幸于一位没有昵称的网友 红心 的推荐,我决定做这本词典。在制作词典的过程中,得到这位网友大力协助,耐心解惑,在探寻制作合理词头的过程中,提供了十分有用的建议,实际上,这也是这本词典现在的实行的词头处理方式。在词典的debug阶段,这位网友也提供了很大的帮助。还有其他几个网友也在debug阶段、制作阶段提供了建议。在此向这些网友表示感谢,特别是红心网友,没有这位网友我就不会做这本词典。

词典介绍 by 红心网友

介绍也是红心网友抽时间写出,在此感谢。

一、关于JEV

日本语教育词汇表(日本語教育語彙表)、简称:JEV(Japanese Education Vocabulary)。是在日语学习者日益增多的大环境下,为了支援日语教育,帮助世界其他国家开发日语学习型词典为目的,于2011年-2014年由「筑波大学」砂川有里子教授(*注1)领导的项目总经费4056万日元的科研项目「汎用的日本語学習辞書開発データベース構築とその基盤形成のための研究」的研究成果。

词汇表共计17920个单词,以2个日语语料库为基础构建而成,包括:

(一)「現代日本語書き言葉均衡コーパス(*注2)」(BCCWJ:Balanced Corpus of Contemporary Written Japanese)

(二)「日本語教科書コーパス」(初级到高级的100册教科书电子版,非公开资料)

、JEV的特点

(一)「語の基本情報」

1、难易度:从初级到高级,分为6个级别。

2、重要度:以「BCCWJ语料库」为基础进行统计,★越多,表示越常用。

3、使用频率:单词所属的难易度级别范围外的使用频率。

4、旧日本语能力考试等级:JEV对应旧JLPT单词的等级情况,总计收录旧JLPT单词7410个(****)(*注3)。

(二)「コロケーション情報」

单词的搭配。

基于「BCCWJ语料库」的「NINJAL-LWP for BCCWJ(NLB)」(http://nlb.ninjal.ac.jp)和「筑波网络语料库」(*注4)的「NINJAL-LWP for TWC(NLT)」(http://nlt.tsukuba.lagoinst.info)构建而成。

(三)「類義語情報」

单词的同义词。

(四)「文化的発見記述文」

以在日本的外国人觉得有意思、感到吃惊、有兴趣的内容为例句,将关键中心词汇列出。

、JEV的使用

JEV并没有像COCA那样给出词频,只是列出了6个难易度级别,以及单词的重要度,使用频率等,所以并不能像COCA那样按照词频排序。

但是根据基于JEV开发的「日本語文章難易度判定システム」(https://jreadability.net/sys/),对于网络上随便的一篇日文文章进行分析,可以从结果中看出,文章中至少95%的单词是包含在JEV中的,所以JEV对于日常生活的使用,是有效的。

*注:

1、砂川有里子  筑波大学,人文社会系,教授

《明镜国语词典》,《日本语句型辞典》的编著者

2、BCCWJ语料库(链接:https://pj.ninjal.ac.jp/corpus_center/bccwj

由书籍、杂志、新闻、白皮书、博客、网络论坛、教科书、法律等来源,构成的1亿450万词汇的日语语料库。

3、筑波网络语料库

筑波ウェブコーパス(Tsukuba Web Corpus: TWC),从日语网站上收集信息构成的11亿日语语料库。

4、JEV并未全部纳入旧JLPT单词的原因在于:JEV以日常使用为目的,而JLPT单词以考试为目的,部分单词并不常用,且缺少与文化相关的词汇。JEV包括了10600(****)个非旧JLPT单词。

基本有颜色的块都可以点击展开。

下载链接

正文完
 2
评论(11 条评论)
hua
2019-03-07 09:49:09 回复

应该还会更新一次 在讨论几个问题

    fans
    2019-03-07 17:20:11 回复

    @hua 其实我更为期待爬虫里的好几部辞典?嘿嘿!

      hua
      2019-03-07 17:21:17 回复

      @fans 你是说把那些做出来?

        fans
        2019-03-07 17:30:55 回复

        @hua 老大做更好。个人做总有这样那样的问题!

      jackie
      2019-04-18 21:22:47 回复

      @fans 不如授之以渔,教授些方法

hua
2019-03-08 00:21:09 回复

别来恶心人啊,转贴不能带有权限以及附上本文地址。来源于freemdict而不是说一句互联网

    fans
    2019-03-09 07:04:58 回复

    @hua 转帖的那人也太那个了…

匿名
2019-05-29 23:47:30 回复

请问有没有办法将原始资料依难易度或重要度排序做成 PDF 或 excel 档?
想拿来作为背生字的依据。

2019-08-04 20:19:34 回复

请问,重要度最多是几颗星呀?

匿名
2019-08-11 18:14:50 回复

如果有发音就更好了