2.5. C#中的字符编码

在用C#进行网页处理时,网络爬虫抓取得到网页的原始字符串后,需要解码才能得到unicode的字符串

详见:【整理】关于HTML网页源码的字符编码(charset)格式(GB2312,GBK,UTF-8,ISO8859-1等)的解释 | 在路上中的"从原始html中解码为对应的unicode字符串"