您好,欢迎光临本网站![请登录][注册会员]  
文件名称: NChardet文本文件编码探测库源码,C#,txt文件编码自动探测
  所属分类: C#
  开发工具:
  文件大小: 112kb
  下载次数: 0
  上传时间: 2013-07-08
  提 供 者: gory****
 详细说明: NChardet文本文件编码探测库源码,C#,txt文件编码自动探测 用于自动探测TXT文本文件编码,支持GB2312、UTF-8、ASCII等几乎所有主流编码的探测,使用方法如下: static public Encoding GetEncoding(string bookPath, ref string charsetName) { charsetName = ""; //1. Japanese //2. Chinese //3. Simplified Chinese //4. Traditional Chinese //5. Korean //6. Dont know (默认) int lang = 2;// //用指定的语参数实例化Detector Detector det = new Detector(lang); //初始化 MyCharsetDetectionObserver cdo = new MyCharsetDetectionObserver(); det.Init(cdo); //输入字符流 //Uri url = new Uri(“http://cn.yahoo.com”); //HttpWebRequest request = // HttpWebRequest)WebRequest.Create(url); //HttpWebResponse response = // (HttpWebResponse)request.GetResponse(); Stream stream = File.OpenRead(bookPath); byte[] buf = new byte[1024]; int len; bool done = false; bool isAscii = true; bool found = false; while ((len = stream.Read(buf, 0, buf.Length)) != 0) { // 探测是否为Ascii编码 if (isAscii) isAscii = det.isAscii(buf, len); // 如果不是Ascii编码,并且编码未确定,则继续探测 if (!isAscii && !done) done = det.DoIt(buf, len, false); } stream.Close(); stream.Dispose(); //调用DatEnd方法, //如果引擎认为已经探测出了正确的编码, //则会在此时调用ICharsetDetectionObserver的Notify方法 det.DataEnd(); if (isAscii) { //Console.WriteLine("CHARSET = ASCII"); found = true; } else if (cdo.Charset != null) { //Console.WriteLine("CHARSET = {0}", cdo.Charset); found = true; } if (found) { charsetName = cdo.Charset; return GetEncodingFromEncodingName(cdo.Charset); } if (!found) { charsetName = ""; string[] prob = det.getProbableCharsets(); for (int i = 0; i < prob.Length; i++) { //Console.WriteLine("Probable Charset = " + prob[i]); } return Encoding.Default; } return Encoding.Default; } static public Encoding GetEncodingFromEncodingName(string charset) { if (string.IsNullOrWhiteSpace(charset)) { charset = "gb2312"; } return Encoding.GetEncoding(charset); } ...展开收缩
(系统自动生成,下载前可以参看下载内容)

下载文件列表

相关说明

  • 本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
  • 本站是交换下载平台,提供交流渠道,下载内容来自于网络,除下载问题外,其它问题请自行百度
  • 本站已设置防盗链,请勿用迅雷、QQ旋风等多线程下载软件下载资源,下载后用WinRAR最新版进行解压.
  • 如果您发现内容无法下载,请稍后再次尝试;或者到消费记录里找到下载记录反馈给我们.
  • 下载后发现下载的内容跟说明不相乎,请到消费记录里找到下载记录反馈给我们,经确认后退回积分.
  • 如下载前有疑问,可以通过点击"提供者"的名字,查看对方的联系方式,联系对方咨询.
 输入关键字,在本站1000多万海量源码库中尽情搜索: