【已解决】PySpider中把一段html的字符串去除entity和unicode escape转义
crifan 6年前 (2018-10-11) 1085浏览 0评论
折腾: 【已解决】PySpider用json.loads字符串出错:json.decoder.JSONDecodeError: Invalid \escape: line 5 column 179 (char 269) 期间,需要把字符串: Chry...
crifan 6年前 (2018-10-11) 1085浏览 0评论
折腾: 【已解决】PySpider用json.loads字符串出错:json.decoder.JSONDecodeError: Invalid \escape: line 5 column 179 (char 269) 期间,需要把字符串: Chry...
crifan 9年前 (2015-10-20) 7672浏览 0评论
对于表情图标,图案来说: Unicode内置支持的话,则就是,字符串类型,而不是图片了 搜了下,找到: Emoji Symbols: Background Data http://www.unicode.org/~scherer/emoji4un...
crifan 11年前 (2014-05-14) 6200浏览 0评论
【背景】 Eclipse+ADT中开发Android项目,其中在xml文件中输入的文字中,带有三个点: 正在初始化设备模型… 结果提示: Replace "…" with ellipsis char...
crifan 11年前 (2013-08-24) 7919浏览 0评论
最后更新:2013-08-24 字符编码简明教程 前言 之前写了个,极其详尽的,关于字符编码的教程: 字符编码详解 由于内容太多,所以,新手学习起来,相对比较耗时和繁琐。 此处,为了更方便的,快速学习和了解,我...
crifan 12年前 (2012-12-20) 6842浏览 0评论
之前可以抓取网页的html了: 【已解决】Android中如何用代码实现去抓取网页 而且后来也确定,是获得了完整的html了: 【已解决】Android中,通过response.getEntity()去获得HttpClient返回的HttpRespo...
crifan 12年前 (2012-11-29) 15114浏览 6评论
此文之前 在读此文之前,你需要了解一些基本的前提知识: 1. Python的两种版本,Python 2.x和Python 3.x,的划分,不了解的去参考: 【整理】总结Python2(Python 2.x版本)和Python3(Python 3.x版...
crifan 12年前 (2012-11-21) 10887浏览 0评论
【背景】 之前就遇到过,现在又有人问这个问题,所以就总结一下: 类似于: \u3232\u6674 的字符串,转换为对应的unicode字符。 【解决过程】 对应的,可以通过Python的decode函数去解码,其中自定原始字符串位unicode-e...
crifan 12年前 (2012-11-20) 7776浏览 0评论
Python 2.7手册中的官方解释是: re.U re.UNICODE Make \w, \W, \b, \B, \d, \D, \s and \S dependent on the Unicode character properties...
crifan 12年前 (2012-09-13) 11137浏览 0评论
【问题】 Mac中,双击一个txt的文本文件,结果打开出错: 【解决过程】 1.很明显,是编码问题所导致的。 2.去把对应文件编码改为UTF-8即可。 此处选用Notepad++。 注:我当前所用的文件,是通过smb共享到Virtualbox中的M...
crifan 13年前 (2012-08-16) 12768浏览 0评论
【问题】 用Source Insight打开一个Python文件,其中包含中文,但是中文在SI中显示的是乱码: 【解决过程】 1.后来去看了下,原先这个文件,是UTF-8编码的。 这说明,目前SI不支持UTF-8编码,所以中文显示乱码。 2.现在就...