找回密码
 立即注册
首页 业界区 业界 c#不可忍受之慢——谁是罪魁祸首

c#不可忍受之慢——谁是罪魁祸首

县挫伪 2025-5-29 19:37:59
    前些日子,爆出N篇说c#/.net太慢的,要求删除c#/.net部分特性的文章。
    撇开那些文章不说,c#/.net慢似乎是业界公认的铁则,不论大家如何证明c#/.net其实不比c++慢多少,但是应用程序级别的性能却依然这么慢。
    那么c#/.net慢在哪里?
    很不幸的是大部分c#程序是被大部分程序员拖慢的,也许这个结论不太容易被人接受,却是一个广泛存在的。
String的操作
    几乎所有的程序都有String操作,至少90%的程序需要忽略大小写的比较,检查一下代码,至少其中大半的应用程序有类似这样的代码:
  1. if (str1.ToUpper() == str2.ToUpper())
复制代码
    或者ToLower版的,甚至我还看到过有个Web的HttpModule里面写上了:
  1. for (int i = 0; i < strs.Count; i++)
  2.     if (value.ToUpper() == strs[i].ToUpper())
  3.         //...
复制代码
    想一下,每个页面请求过来,都要执行这样一段代码,大片大片的创建string实例,更夸张的是还有人说这是用空间换时间。。。
性能测试
    说这个方法慢,也许还有人不承认,认为这个就是最好的方法,所以这里要用具体测试来摆个事实。
    首先准备一个测试性能的方法:
  1. private static TResult MeasurePerformance<TArg, TResult>(Func<TArg, TResult> func, TArg arg, int loop)
  2. {
  3.     GC.Collect();
  4.     int gc0 = GC.CollectionCount(0);
  5.     int gc1 = GC.CollectionCount(1);
  6.     int gc2 = GC.CollectionCount(2);
  7.     TResult result = default(TResult);
  8.     Stopwatch sw = Stopwatch.StartNew();
  9.     for (int i = 0; i < loop; i++)
  10.     {
  11.         result = func(arg);
  12.     }
  13.     Console.WriteLine(sw.ElapsedMilliseconds.ToString() + "ms");
  14.     Console.WriteLine("GC 0:" + (GC.CollectionCount(0) - gc0).ToString());
  15.     Console.WriteLine("GC 1:" + (GC.CollectionCount(1) - gc1).ToString());
  16.     Console.WriteLine("GC 2:" + (GC.CollectionCount(2) - gc2).ToString());
  17.     return result;
  18. }
复制代码
    然后来准备一个堆string:
  1. private static List<string> CreateStrings()
  2. {
  3.     List<string> strs = new List<string>(10000);
  4.     char[] chs = new char[3];
  5.     for (int i = 0; i < 10000; i++)
  6.     {
  7.         int j = i;
  8.         for (int k = 0; k < chs.Length; k++)
  9.         {
  10.             chs[k] = (char)('a' + j % 26);
  11.             j = j / 26;
  12.         }
  13.         strs.Add(new string(chs));
  14.     }
  15.     return strs;
  16. }
复制代码
    然后来看看ToUpper的实现:
  1. private static bool ImplementByToUpper(List<string> strs, string value)
  2. {
  3.     for (int i = 0; i < strs.Count; i++)
  4.         if (value.ToUpper() == strs[i].ToUpper())
  5.             return true;
  6.     return false;
  7. }
复制代码
    最后准备好main方法:
  1. List<string> strs = CreateStrings();
  2. bool result;
  3. Console.WriteLine("Use ImplementByToUpper");
  4. result = MeasurePerformance(s => ImplementByToUpper(strs, s), "yZh", 1000);
  5. Console.WriteLine("result is " + result.ToString());
  6. Console.ReadLine();
复制代码
    来看看执行结果:
Use ImplementByToUpper
2192ms
GC 0:247
GC 1:0
GC 2:0
result is True
    来个对比测试,用string.Equals来测试一下:
  1. private static bool ImplementByStringEquals(List<string> strs, string value)
  2. {
  3.     for (int i = 0; i < strs.Count; i++)
  4.         if (string.Equals(value, strs[i], StringComparison.CurrentCultureIgnoreCase))
  5.             return true;
  6.     return false;
  7. }
复制代码
    来看看执行结果:
Use ImplementByStringEquals
1117ms
GC 0:0
GC 1:0
GC 2:0
result is True
    对比一下,使用ToUpper的速度要慢一倍,并且有大量的0代垃圾对象。那些号称是用空间换时间的人可以反思一下了,用空间换来了什么?负时间吗?
字典类的使用
    继续说string的场景,有些人也许会想到用Hash表等类似结构来加速,不错,这是个好主意,只不过,Hash表不一定总是最佳方案,什么不相信?还是做个测试吧:
  1. private static bool ImplementByHashSet(List<string> strs, string value)
  2. {
  3.     HashSet<string> set = new HashSet<string>(strs, StringComparer.CurrentCultureIgnoreCase);
  4.     return set.Contains(value);
  5. }
复制代码
    看看执行结果:
Use ImplementByHashSet
5114ms
GC 0:38
GC 1:38
GC 2:38
result is True
    惊讶吧,速度比用ToUpper还慢了1倍多,而且2代垃圾也38次的回收(执行2代垃圾回收时,会强制执行1代和0代垃圾回收)。
    不过使用Hash表等类似来加速这个想法本身是一个很正确的想法,不过前提是Hash表本身能够缓存,例如:
  1. private static Func<string, bool> ImplementByHashSet2(List<string> strs)
  2. {
  3.     HashSet<string> set = new HashSet<string>(strs, StringComparer.CurrentCultureIgnoreCase);
  4.     return set.Contains;
  5. }
复制代码
    然后把main的方法修改为:
  1. Console.WriteLine("Use ImplementByHashSet2");
  2. result = MeasurePerformance(s =>
  3. {
  4.     var f = ImplementByHashSet2(strs);
  5.     bool ret = false;
  6.     for (int i = 0; i < 1000; i++)
  7.     {
  8.         ret = f(s);
  9.     }
  10.     return ret;
  11. }, "yZh", 1);
  12. Console.WriteLine("result is " + result.ToString());
  13. Console.ReadLine();
复制代码
    再看看结果:
Use ImplementByHashSet2
6ms
GC 0:0
GC 1:0
GC 2:0
result is True
    性能出现了飞跃性的增长。
更多
    是什么拖慢了c#/.net?简单的说:不必要的创建对象,不必要的同步,循环执行低效的方法(例如被firelong重点批斗的反射,不过ms并没让你在循环里面使用Invoke),使用低效的数据结构和算法(看看缓存情况下Hash表类似结构的惊人表现,就知道区别了)
    c#/.net的低门槛确实在一定程度上有利于把更多的程序员拉入c#/.net,但是也确实把整个c#/.net程序的代码水平降低了不少,这一点确实很令人担忧。
    最后别忘了一点,一个系统能有多少性能,不是由这个系统中性能最好的部分决定的,而是由这个系统中性能最差的部分所决定的。配一台有16g内存,100t硬盘,加上顶级的显卡,缺配上386的cpu,这台电脑的性能就是386的性能。同样,c#/.net再好,写程序的人水平差,写出来的程序的性能自然也就差了。

来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
您需要登录后才可以回帖 登录 | 立即注册