#!/usr/bin/python
# -*- coding: utf-8 -*-
"""
Function:
【记录】折腾Python中的mmseg中文分词模块
http://www.crifan.com/try_python_mmseg_chinese_segment_on_mmseg_algorithm
Author: Crifan Li
Version: 2013-01-02
Contact: admin at crifan dot com
"""
from mmseg import seg_txt;
def tryMmseg():
for i in seg_txt("最主要的更动是:张无忌最后没有选定自己的配偶。"):
print i;
if __name__ == "__main__":
tryMmseg();
结果出错了:
E:\Dev_Root\python\try_mmseg>try_mmseg.py
Traceback (most recent call last):
File "E:\Dev_Root\python\try_mmseg\try_mmseg.py", line 13, in <module>
from mmseg import seg_txt;
File "E:\dev_install_root\Python27\lib\site-packages\mmseg-1.3.0-py2.7-win-amd64.egg\mmseg\__init__.py", line 3, in <m
odule>
import _mmseg as mmseg
File "E:\dev_install_root\Python27\lib\site-packages\mmseg-1.3.0-py2.7-win-amd64.egg\mmseg\_mmseg.py", line 28, in <mo
dule>
mmseg = cdll.LoadLibrary(mmseg_lib_path)
File "E:\dev_install_root\Python27\lib\ctypes\__init__.py", line 431, in LoadLibrary
return self._dlltype(name)
File "E:\dev_install_root\Python27\lib\ctypes\__init__.py", line 353, in __init__
self._handle = _dlopen(self._name, mode)
WindowsError: [Error 126]
【解决过程】
1.以为是代码中导入有问题呢。
所以参考:
mmseg 1.3.0
去执行search结果也是同样错误:
E:\Dev_Root\python\try_mmseg>python -m mmseg.search
Traceback (most recent call last):
File "E:\dev_install_root\Python27\lib\runpy.py", line 151, in _run_module_as_main
mod_name, loader, code, fname = _get_module_details(mod_name)
File "E:\dev_install_root\Python27\lib\runpy.py", line 101, in _get_module_details
loader = get_loader(mod_name)
File "E:\dev_install_root\Python27\lib\pkgutil.py", line 456, in get_loader
return find_loader(fullname)
File "E:\dev_install_root\Python27\lib\pkgutil.py", line 466, in find_loader
for importer in iter_importers(fullname):
File "E:\dev_install_root\Python27\lib\pkgutil.py", line 422, in iter_importers
__import__(pkg)
File "E:\dev_install_root\Python27\lib\site-packages\mmseg-1.3.0-py2.7-win-amd64.egg\mmseg\__init__.py", line 3, in <m
odule>
import _mmseg as mmseg
File "E:\dev_install_root\Python27\lib\site-packages\mmseg-1.3.0-py2.7-win-amd64.egg\mmseg\_mmseg.py", line 28, in <mo
dule>
mmseg = cdll.LoadLibrary(mmseg_lib_path)
File "E:\dev_install_root\Python27\lib\ctypes\__init__.py", line 431, in LoadLibrary
return self._dlltype(name)
File "E:\dev_install_root\Python27\lib\ctypes\__init__.py", line 353, in __init__
self._handle = _dlopen(self._name, mode)
WindowsError: [Error 126]
2.去查了下,知道了错误的意思,就是没有找到对应的dll库,说白了,就是之前没有正常的完整编译mmseg,所以后来误以为正确安装,此处运行代码出错。
3.关于此,专门去删除了旧的mmseg-1.3.0,重新解压了一份mmseg-1.3.0,然后再去setup.py install结果的确是无法正常编译。所以验证了此处的猜测:
没有正常编译和安装mmseg,导致此处的WindowsError: [Error 126]的错误。
分享到:
相关推荐
开源地址 ...MMSeg 算法有两种分词方法:Simple和Complex,都是基于正向最大匹配。Complex 加了四个规则过虑。官方说:词语的正确识别率达到了 98.41%。mmseg4j 已经实现了这两种分词算法。
clj-cn-mmseg clj-cn-mmseg是一个用clojure实现的mmseg中文分词工具包。使用使用Leiningen,在project.clj文件中dependencies中加入如下依赖: [clj-cn-mmseg " 0.1.5 " ]使用Maven,则在pom.xml文件中加入: ...
实现中文分类公共开元代码,以及测试可用。先编译configure,出现错误添加头文件
本文实例讲述了Python中文分词实现方法。分享给大家供大家参考,具体如下: 在Python这pymmseg-cpp 还是十分方便的!...python build.py #生成 mmseg.so文件 3 将 pymmseg 目录复制到 /usr/local/lib/py
该插件随附以下分析器: mmseg_maxword , mmseg_complex , mmseg_simple和令牌生成器: mmseg_maxword , mmseg_complex , mmseg_simple和token_filter: cut_letter_digit 。 版本号 Mmseg版本 ES版 掌握 5.x->...
mmseg4j-core-1.10.1-SNAPSHOT.jar
mmseg4j
<tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="complex" dicPath="dic"/> <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="max-word" /> ...
本人用的solr是4.10的,经过本人亲测可用,放心下载,包含以下3个jar包: mmseg4j-analysis-1.9.1.jar, mmseg4j-core-1.9.1.jar, mmseg4j-solr-2.2.0.jar
mmseg4j-1.9.1
ik+mmseg分词器,适用于solr6.1版本,内附说明 亲测可用!!!
mmseg4j-core, 用于java中文分析器的mmseg4j核心 MMSEG <dependency> <groupId>com.chenlb.mmseg4j</groupId> <artifactId>mmseg4j-core</artif
mmseg4j-solr-2.4.0.jar mmseg4j-analysis-1.9.1.jar mmseg4j-core-1.10.0.jar
mmseg4j 2.3 源码 Lucene 中文分词器
mmseg4j-solr-mmseg4j-solr-2.2.0.zip
该压缩包包含`mmseg4j-solr-2.3.2.jar`和`mmseg4j-core-1.10.0.jar`,其中solr-2.3.2不是官方的版本,该版本有改动,使得mmseg4j可以很好的支持Solr6,如果你的Solr低于Solr6,请使用官方的mmseg4j-solr-2.3.0.jar...
中文分词包使用 1.mmseg4j中文分词包(下载、安装与运行) 2.分词方法与效果分析 3.分词包算法学习 4.分词结果 5.词云分析
solr6配置mmseg4j,里面包含mmseg4j需要jar包、dic文件、详细配置说明文档,里面有详细截图和需要文件
solr6.3下好用的mmseg4j分词库,测试可用。