- pattern_Syntactic.py:基于依存句法模板的抽取脚本父类文件
- pattern_Syntactic_contain.py:基于“包含”依存句法模板的抽取脚本
- pattern_Syntactic_isA.py:基于“是一个”依存句法模板的抽取脚本
- pattern_Syntactic_oneOf.py:基于“之一”依存句法模板的抽取脚本
- pattern_Syntactic_deng.py:基于“等”依存句法模板的抽取脚本
- pattern_Lexical.py:基于词法模板的抽取脚本父类文件
- pattern_Lexical_contain.py:基于“包含”词法模板的抽取脚本
- pattern_Lexical_isA.py:基于“是一个”词法模板的抽取脚本
- pattern_Lexical_oneOf.py:基于“之一”词法模板的抽取脚本
- pattern_Lexical_deng.py:基于“等”词法模板的抽取脚本
- word_pairs_true.txt:高置信度的上下位词对正例集合
- words.conll:上下位词语限定范围词典
- Hypernym.txt:上位词词典
- 其他文件:用于替换模板中占位符的谓语、量词等词典
- new_hypernymy_600-task.txt:首次标注的600个词对(词法模板和句法模板抽取结果的并集)
- hypernymy_mix_dif_600-task.txt:第二次标注的600个词对(词法模板和句法模板抽取结果的差集)
- new_hypernymy_1600-task.txt:用于计算准确度标注的1600个词对
将dictionary文件夹中的词典放至code文件夹中,修改各模板抽取脚本main函数中的源文件名,即可运行。词法模板需要进行分词、词性标注预处理工作,句法模板需要进行分词、词性标注、依存句法标注预处理工作,文件格式参考CoNLL格式。