LZW压缩算法
作者:追风剑情 发布于:2022-1-20 15:21 分类:C#
using System; using System.Text; using System.Collections; using System.Collections.Generic; using System.IO; namespace LZWTest { class Program { static void Main(string[] args) { string test = "ABABCDCDABCD"; Console.WriteLine("测试字符串 {0}", test); LZW lzw = new LZW(); List<ushort> compress = lzw.Encode(test); Console.WriteLine(); Console.WriteLine("压缩列表"); for (int i = 0; i < compress.Count; i++) Console.Write(compress[i] + " "); Console.WriteLine(); string str = lzw.Decode(compress); Console.WriteLine(); Console.WriteLine("方式一 解压 {0}", str); byte[] compressBytes = lzw.GetCompressData(); string str1 = lzw.Decode(compressBytes); Console.WriteLine("方式二 解压 {0}", str); Console.Read(); } } /// <summary> /// 串表压缩算法(LZW) /// 用12位来表示可能的字符串或字符,前256代表单字符,剩下的3840给可能出现的字符组合 /// /// GIF规范 /// 1.原始数据用8位表示 /// 2.标号用9位-12位表示(256-4096) /// 3.标号一开始用9位表示(256-512),当达到512时再用10位表示,依次类推 /// 4.当达到12位能表示的最大数时(4096),在这里插入清除标志,又从9位开始 /// 5.清除标志(clear flag)的值是原始数据字长表示的最大值加1 /// 6.结束标志(end flag)的值是原始数据字长表示的最大值加2 /// </summary> public sealed class LZW { //清除标志 private ushort clearFlag = 256; //结束标志 private ushort endFlag = 257; //字典最大长度 private int maxDicCount = 4096; //存储压缩后的bit流 private MemoryStream compressStream; private BinaryWriter compressWriter; private byte[] compressData; //初始化标号字典 private void InitCodeDic(Dictionary<ZString, ushort> codeDic) { codeDic.Clear(); //原始数据设置到标号字典中 for (ushort i = 0; i <= 255; i++) { char c = (char)i; ZString key = new ZString(c); codeDic.Add(key, i); } } //编码 public List<ushort> Encode(string str) { compressStream = new MemoryStream(); compressWriter = new BinaryWriter(compressStream); //输出列表 List<ushort> output = new List<ushort>(); //查询表<前缀字符串, 编码> Dictionary<ZString, ushort> codeDic = new Dictionary<ZString, ushort>(); //前缀 ZString prefix = null; //后缀 ZString suffix = null; //标号 ushort mark = 258; InitCodeDic(codeDic); if (prefix == null) prefix = new ZString(); Console.WriteLine("建立字典"); ushort code; for (int i=0; i<str.Length; i++) { char c = str[i]; if (prefix.IsNullOrEmpty()) { prefix.Add(c); continue; } suffix = new ZString(c); ZString key = prefix + suffix; if (codeDic.ContainsKey(key)) { prefix = key; } else { codeDic.Add(key, mark); mark++; code = codeDic[prefix]; output.Add(code); Console.WriteLine("{0}->{1}", prefix, code); prefix = suffix; WriteCompressStream(code, 12, compressWriter); //字典长度已达上限 if (codeDic.Count >= maxDicCount) { //插入清除标志 output.Add(clearFlag); InitCodeDic(codeDic); prefix.Clear(); mark = 258; WriteCompressStream(clearFlag, 12, compressWriter); } } } //考虑最后一个字符 code = codeDic[prefix]; output.Add(code); //插入结束标志 output.Add(endFlag); Console.WriteLine("{0}->{1}", prefix, code); WriteCompressStream(endFlag, 12, compressWriter); BinaryReader br = new BinaryReader(compressStream); compressData = br.ReadBytes((int)compressStream.Length); return output; } //获取压缩后的数据 public byte[] GetCompressData() { return compressData; } //解码 (按照单字符8bit,组合字符12bit解码) public string Decode(byte[] bytes) { //转成bit数组 BitArray bitArray = new BitArray(bytes); //输出列表 List<byte> output = new List<byte>(); //查询表<编码,字符串> Dictionary<ushort, ZString> codeDic = new Dictionary<ushort, ZString>(); ZString prefix = new ZString(); ushort mark = 258; int bitIndex = 0; while (bitIndex < bitArray.Length) { ushort code = bitArray.GetUShort(bitIndex, 12); if (code <= 255) { output.Add((byte)code); prefix.Add(code); if (prefix.Count == 1) continue; //前缀为多字符时加入字典 (重建字典) if (!codeDic.ContainsKey(mark)) { codeDic.Add(mark, prefix); prefix = new ZString(code); mark++; } continue; } else if (code == clearFlag) { codeDic.Clear(); prefix.Clear(); mark = 258; } else if (code == endFlag) { break; } else if (codeDic.ContainsKey(code)) { prefix = codeDic[code]; output.AddRange(prefix.ToArray()); mark++; continue; } else { Console.WriteLine("重建字典出错,未找到 code={0} 对应的子串", code); } } return Encoding.ASCII.GetString(output.ToArray()); } //解码 public string Decode(List<ushort> list) { //输出列表 List<byte> output = new List<byte>(); //查询表<编码,字符串> Dictionary<ushort, ZString> codeDic = new Dictionary<ushort, ZString>(); ZString prefix = new ZString(); ushort mark = 258; for (ushort i=0; i<list.Count; i++) { ushort code = list[i]; //原始ASCII字符直接输出 if (code <= 255) { output.Add((byte)code); prefix.Add(code); if (prefix.Count == 1) continue; //前缀为多字符时加入字典 (重建字典) if (!codeDic.ContainsKey(mark)) { codeDic.Add(mark, prefix); prefix = new ZString(code); mark++; } continue; } else if (code == clearFlag) { codeDic.Clear(); prefix.Clear(); mark = 258; continue; } else if (code == endFlag) { break; } else if (codeDic.ContainsKey(code)) { prefix = codeDic[code]; output.AddRange(prefix.ToArray()); mark++; continue; } else { //如果执行到这里,说明动态重建查询表出了问题 Console.WriteLine("无法查询到 code={0} 对应的字符串", code); } } return Encoding.ASCII.GetString(output.ToArray()); } //将数据写入压缩流 private void WriteCompressStream(ushort value, int bitSize, BinaryWriter bw) { BitArray arr = new BitArray(new int[1] { value }); for (int i = 0; i < bitSize; i++) { bw.Write(arr[i]); } bw.Flush(); } public class ZString { private List<byte> list = new List<byte>(); public ZString() { } public ZString(char c) { Add(c); } public ZString(string s) { Add(s); } public ZString(int i) { Add(i); } public ZString(byte b) { Add(b); } public int Count { get { return list.Count; } } public byte[] ToArray() { return list.ToArray(); } public bool IsNullOrEmpty() { return list.Count == 0; } public void Add(byte[] bytes) { if (bytes == null) return; list.AddRange(bytes); } public void Add(int i) { list.Add((byte)i); } public void Add(char c) { byte b = (byte)c; list.Add(b); } public void Add(byte b) { list.Add(b); } public void Add(string str) { if (string.IsNullOrEmpty(str)) return; for (int i = 0; i < str.Length; i++) Add(str[i]); } public void Clear() { list.Clear(); } public override int GetHashCode() { //BKDR Hash ulong hash = 0; //也可以乘以31、131、1313、13131、131313.. uint p = 1313; for (int i=0; i<list.Count; i++) { //当作p进制计算 hash = hash * p + list[i]; } return (int)hash; } public override bool Equals(object obj) { ZString key = obj as ZString; if (key == null) return false; return GetHashCode() == key.GetHashCode(); } public override string ToString() { return Encoding.ASCII.GetString(list.ToArray()); } public static ZString operator +(ZString a, ZString b) { ZString zs = new ZString(); zs.Add(a.ToArray()); zs.Add(b.ToArray()); return zs; } public static ZString operator +(ZString a, char b) { ZString zs = new ZString(); zs.Add(a.ToArray()); zs.Add(b); return zs; } } } } public static class BitArrayExtension { public static int GetInt(this BitArray array, int startIndex, int bitLength) { var newArray = new BitArray(bitLength); for (int i = 0; i < bitLength; i++) { if (array.Length <= startIndex + i) { newArray[i] = false; } else { bool bit = array.Get(startIndex + i); newArray[i] = bit; } } return newArray.ToInt(); } public static int ToInt(this BitArray array) { if (array == null) { Console.WriteLine("array is nothing."); return 0; } if (array.Length > 32) { Console.WriteLine("must be at most 32 bits long."); return 0; } var result = new int[1]; array.CopyTo(result, 0); return result[0]; } public static ushort GetUShort(this BitArray array, int startIndex, int bitLength) { var newArray = new BitArray(bitLength); for (int i = 0; i < bitLength; i++) { if (array.Length <= startIndex + i) { newArray[i] = false; } else { bool bit = array.Get(startIndex + i); newArray[i] = bit; } } return newArray.ToUShort(); } public static ushort ToUShort(this BitArray array) { if (array == null) { Console.WriteLine("array is nothing."); return 0; } if (array.Length > 32) { Console.WriteLine("must be at most 32 bits long."); return 0; } var result = new int[1]; array.CopyTo(result, 0); return (ushort)result[0]; } }
运行效果
标签: C#
日历
最新文章
随机文章
热门文章
分类
存档
- 2024年11月(3)
- 2024年10月(5)
- 2024年9月(3)
- 2024年8月(3)
- 2024年7月(11)
- 2024年6月(3)
- 2024年5月(9)
- 2024年4月(10)
- 2024年3月(11)
- 2024年2月(24)
- 2024年1月(12)
- 2023年12月(3)
- 2023年11月(9)
- 2023年10月(7)
- 2023年9月(2)
- 2023年8月(7)
- 2023年7月(9)
- 2023年6月(6)
- 2023年5月(7)
- 2023年4月(11)
- 2023年3月(6)
- 2023年2月(11)
- 2023年1月(8)
- 2022年12月(2)
- 2022年11月(4)
- 2022年10月(10)
- 2022年9月(2)
- 2022年8月(13)
- 2022年7月(7)
- 2022年6月(11)
- 2022年5月(18)
- 2022年4月(29)
- 2022年3月(5)
- 2022年2月(6)
- 2022年1月(8)
- 2021年12月(5)
- 2021年11月(3)
- 2021年10月(4)
- 2021年9月(9)
- 2021年8月(14)
- 2021年7月(8)
- 2021年6月(5)
- 2021年5月(2)
- 2021年4月(3)
- 2021年3月(7)
- 2021年2月(2)
- 2021年1月(8)
- 2020年12月(7)
- 2020年11月(2)
- 2020年10月(6)
- 2020年9月(9)
- 2020年8月(10)
- 2020年7月(9)
- 2020年6月(18)
- 2020年5月(4)
- 2020年4月(25)
- 2020年3月(38)
- 2020年1月(21)
- 2019年12月(13)
- 2019年11月(29)
- 2019年10月(44)
- 2019年9月(17)
- 2019年8月(18)
- 2019年7月(25)
- 2019年6月(25)
- 2019年5月(17)
- 2019年4月(10)
- 2019年3月(36)
- 2019年2月(35)
- 2019年1月(28)
- 2018年12月(30)
- 2018年11月(22)
- 2018年10月(4)
- 2018年9月(7)
- 2018年8月(13)
- 2018年7月(13)
- 2018年6月(6)
- 2018年5月(5)
- 2018年4月(13)
- 2018年3月(5)
- 2018年2月(3)
- 2018年1月(8)
- 2017年12月(35)
- 2017年11月(17)
- 2017年10月(16)
- 2017年9月(17)
- 2017年8月(20)
- 2017年7月(34)
- 2017年6月(17)
- 2017年5月(15)
- 2017年4月(32)
- 2017年3月(8)
- 2017年2月(2)
- 2017年1月(5)
- 2016年12月(14)
- 2016年11月(26)
- 2016年10月(12)
- 2016年9月(25)
- 2016年8月(32)
- 2016年7月(14)
- 2016年6月(21)
- 2016年5月(17)
- 2016年4月(13)
- 2016年3月(8)
- 2016年2月(8)
- 2016年1月(18)
- 2015年12月(13)
- 2015年11月(15)
- 2015年10月(12)
- 2015年9月(18)
- 2015年8月(21)
- 2015年7月(35)
- 2015年6月(13)
- 2015年5月(9)
- 2015年4月(4)
- 2015年3月(5)
- 2015年2月(4)
- 2015年1月(13)
- 2014年12月(7)
- 2014年11月(5)
- 2014年10月(4)
- 2014年9月(8)
- 2014年8月(16)
- 2014年7月(26)
- 2014年6月(22)
- 2014年5月(28)
- 2014年4月(15)
友情链接
- Unity官网
- Unity圣典
- Unity在线手册
- Unity中文手册(圣典)
- Unity官方中文论坛
- Unity游戏蛮牛用户文档
- Unity下载存档
- Unity引擎源码下载
- Unity服务
- Unity Ads
- wiki.unity3d
- Visual Studio Code官网
- SenseAR开发文档
- MSDN
- C# 参考
- C# 编程指南
- .NET Framework类库
- .NET 文档
- .NET 开发
- WPF官方文档
- uLua
- xLua
- SharpZipLib
- Protobuf-net
- Protobuf.js
- OpenSSL
- OPEN CASCADE
- JSON
- MessagePack
- C在线工具
- 游戏蛮牛
- GreenVPN
- 聚合数据
- 热云
- 融云
- 腾讯云
- 腾讯开放平台
- 腾讯游戏服务
- 腾讯游戏开发者平台
- 腾讯课堂
- 微信开放平台
- 腾讯实时音视频
- 腾讯即时通信IM
- 微信公众平台技术文档
- 白鹭引擎官网
- 白鹭引擎开放平台
- 白鹭引擎开发文档
- FairyGUI编辑器
- PureMVC-TypeScript
- 讯飞开放平台
- 亲加通讯云
- Cygwin
- Mono开发者联盟
- Scut游戏服务器引擎
- KBEngine游戏服务器引擎
- Photon游戏服务器引擎
- 码云
- SharpSvn
- 腾讯bugly
- 4399原创平台
- 开源中国
- Firebase
- Firebase-Admob-Unity
- google-services-unity
- Firebase SDK for Unity
- Google-Firebase-SDK
- AppsFlyer SDK
- android-repository
- CQASO
- Facebook开发者平台
- gradle下载
- GradleBuildTool下载
- Android Developers
- Google中国开发者
- AndroidDevTools
- Android社区
- Android开发工具
- Google Play Games Services
- Google商店
- Google APIs for Android
- 金钱豹VPN
- TouchSense SDK
- MakeHuman
- Online RSA Key Converter
- Windows UWP应用
- Visual Studio For Unity
- Open CASCADE Technology
- 慕课网
- 阿里云服务器ECS
- 在线免费文字转语音系统
- AI Studio
- 网云穿
- 百度网盘开放平台
- 迅捷画图
- 菜鸟工具
- [CSDN] 程序员研修院
- 华为人脸识别
- 百度AR导航导览SDK
- 海康威视官网
- 海康开放平台
- 海康SDK下载
- git download
交流QQ群
-
Flash游戏设计: 86184192
Unity游戏设计: 171855449
游戏设计订阅号