使用 Java 进行 NEologd 的预处理 neologdn-java
嗨…†
在 @ragion 的协助下,我们终于发布了 NEologd 的 Java 前处理模块 neologd-java!
这是什么?
即便在辞書数据中冗余并吸收异表达方式,也存在着一定的限度。
在生成辞書数据时,我们将以下规范化处理应用于所有解析文本,这样一来,将以下规范化处理应用于目标文本后,与辞書中的词匹配会更容易。
正如上述页面所述,在使用MeCab进行解析之前进行规范化处理(预处理)非常重要。因此,我创建了一个在Java中使用NEologd的预处理模块neologd-java。
怎么使用?
如果是Maven的情况
由于Maven Central已注册,因此将以下内容添加到pom.xml中。
<dependency>
<groupId>io.github.ikegami-yukino</groupId>
<artifactId>neologdn</artifactId>
<version>0.0.1</version>
</dependency>
并且,
package yukinoi.neologdn_example;
import io.github.ikegamiyukino.neologdn.NeologdNormalizer;
/**
* neologdn-example
*
*/
public class App
{
public static void main(String[] args)
{
NeologdNormalizer normalizer = new NeologdNormalizer();
String text = " PRML 副 読 本 ";
String normalizedText = normalizer.normalize(text);
System.out.println(normalizedText);
}
}
像这样使用。
我想要做出贡献!
我正在以下的GitHub存储库中开发:
https://github.com/ikegami-yukino/neologdn-java
欢迎贡献!