























fp = urllib2.urlopen(request)
charset = fp.headers.getparam('charset')
对于中文网页,charset可能的值有:UTF-8, GB2312
不过urllib2有点问题,UTF-8能正确判断,但有些GB2312的网页,不能正确判断,而是返回None,例如 http://news.sina.com.cn 这点需要注意
--------------------------------------------------------------------------------
另外一个方法是用 chardet,http://chardet.feedparser.org/
但chardet性能有问题。
此内容由惯性聚合(RSS阅读器)自动聚合整理,仅供阅读参考。 原文来自 — 版权归原作者所有。