最新消息:20210816 当前crifan.com域名已被污染,为防止失联,请关注(页面右下角的)公众号

标签:中文

【整理】Jieba分词
Python

【整理】Jieba分词

crifan 5年前 (2019-09-03) 1069浏览 0评论

自然语言处理时,通常的文本清理流程是什么? – 知乎 -》 Jieba分词 fxsjy/jieba: 结巴中文分词 Python中文分词 jieba 十五分钟入门与进阶 – FontTian的专栏 – CSDN博客...

【整理】使用Google翻译去翻译韩文为中文
google

【整理】使用Google翻译去翻译韩文为中文

crifan 11年前 (2014-03-17) 4475浏览 0评论

背景 当遇到不懂的语言的内容时,可以借助于各种翻译工具,翻译成能看懂的文字。 比如在: 【整理】如何在Gmarket上查找所需要的商品 期间,遇到韩文,看不懂,所以此处可以考虑借助于google翻译,将其翻译为能看得懂的中文。 用Google翻译去翻...

【整理】Python中实际上已经得到了正确的Unicode或某种编码的字符,但是看起来或打印出来却是乱码
StringEncoding

【整理】Python中实际上已经得到了正确的Unicode或某种编码的字符,但是看起来或打印出来却是乱码

crifan 12年前 (2013-07-19) 10316浏览 6评论

【背景】 Python中的字符编码,其实的确有点复杂。 再加上,不同的开发环境和工具中,显示的逻辑和效果又不太相同,尤其是,中文的,初级用户,最常遇到的: (1)在Python自带的IDE:IDLE中折腾中文字符,结果看到的差不多都是乱码类的东西,比...

【已解决】Eclipse中的中文字符显示乱码
Eclipse

【已解决】Eclipse中的中文字符显示乱码

crifan 12年前 (2013-07-18) 9340浏览 0评论

【问题】 之前已经专门用Notepad++转好的,UTF-8编码的一个java文件: 在用Eclipse打开,结果显示出乱码: 【解决过程】 1.一看就知道是编码问题。 所以,去设置成对应的编码:   当前,用的是默认的GBK: 去...

72 queries in 0.201 seconds, using 22.10MB memory