尧图网站建设 尧图网络
  • 首页
  • 关于我们
  • 服务项目
  • 案例展示
  • 建站流程
  • 资讯中心
  • 联系我们
首页/资讯中心/详情

C++/C#/F#/Java/JS/Lua/Python/Ruby渲染比试

C++/C#/F#/Java/JS/Lua/Python/Ruby渲染比试
📅 发布时间:2026/7/6 0:22:09

首先,为免误会,再次重申,本测试有其局限,只能测试某一应用、某一实现的结果,并不能反映编程语言及其运行时的综合性能,亦无意尝试这样做。而实验环境也只限于某机器、某操作系统上,并不全面。而且,本测试只提供运行时间的结果,不考虑、不比较语言/平台间的技术性和非技术性优缺点,也没有测试运行期内存。世界上的软件应用林林总总,性能需求也完全不同,本测试只供参考。

由于本人第一次使用Python和Ruby,若代码有不当之处,敬请告之。当然也非常乐见其他意见。

测试内容

本文测试程序为一个全局光照渲染器,是一个CPU运算密集的控制台应用程序(console application),功能详见前文。在前文刊出后,本人进行了一点profiling、优化,并把代码重新格式化。本渲染器除了有大量数学运算,亦会产生大量临时对象,并进行极多的方法调用(非虚函数)。本测试有别于人工合成的测试(synthetic tests,例如个别测试运算、字串操作、输入输出等),是一个有实际用途的程序。

移植时尽量维持原代码的逻辑,主要采用面向对象范式。优化方面,不进行人手内联函数(inline function),但优化了一些不必要的重复运算。

测试配置

  • 硬件: Intel Core i7 920@2.67Ghz(4 core, HyperThread), 12GB RAM
  • 操作系统: Microsoft Windows 7 64-bit
测试名称编译器/解译器编译/运行选项
VC++Visual C++ 2008 (32-bit)/Ox /Ob2 /Oi /Ot /GL /FD /MD /GS- /Gy /arch:SSE /fp:fast
VC++_OpenMPVisual C++ 2008 (32-bit)/Ox /Ob2 /Oi /Ot /GL /FD /MD /GS- /Gy /arch:SSE /fp:fast /openmp
IC++Intel C++ Compiler (32-bit)/Ox /Og /Ob2 /Oi /Ot /Qipo /GA /MD /GS- /Gy /arch:SSE2 /fp:fast /Zi /QxHost
IC++_OpenMPIntel C++ Compiler (32-bit)/Ox /Og /Ob2 /Oi /Ot /Qipo /GA /MD /GS- /Gy /arch:SSE2 /fp:fast /Zi /QxHost /Qopenmp
GCCGCC 4.3.4 in Cygwin (32-bit)-O3 -march=native -ffast-math
GCC_OpenMPGCC 4.3.4 in Cygwin (32-bit)-O3 -march=native -ffast-math -fopenmp
C++/CLIVisual C++ 2008 (32-bit), .Net Framework 3.5/Ox /Ob2 /Oi /Ot /GL /FD /MD /GS- /fp:fast /Zi /clr /TP
C++/CLI_OpenMPVisual C++ 2008 (32-bit), .Net Framework 3.5/Ox /Ob2 /Oi /Ot /GL /FD /MD /GS- /fp:fast /Zi /clr /TP /openmp
C#Visual C# 2008 (32-bit), .Net Framework 3.5
*C#_outrefVisual C# 2008 (32-bit), .Net Framework 3.5
F#

F# 2.0 (32-bit), .Net Framework 3.5

JavaJava SE 1.6.0_17-server
JsChromeChrome 5.0.375.86
JsFirefoxFirefox 3.6
LuaJITLuaJIT 2.0.0-beta4 (32-bit)
LuaLuaJIT (32-bit)-joff
PythonPython 3.1.2 (32-bit)
*IronPythonIronPython 2.6 for .Net 4
*JythonJython 2.5.1
RubyRuby 1.9.1p378

* 见本文最后的"7.更新"一节

渲染的解像度为256x256,每象素作100次采样。

结果及分析

下表中预设的相对时间以最快的单线程测试(IC++)作基准,用鼠标按列可改变基准。由于Ruby运行时间太长,只每象素作4次采样,把时间乘上25。另外,因为各测试的渲染时间相差很远,所以用了两个棒形图去显示数据,分别显示时间少于4000秒和少于60秒的测试(Ruby是4000秒以外,不予显示)。

C++/.Net/Java组别

静态语言和动态语言在此测试下的性能不在同一数量级。先比较静态语言。

C++和.Net的测试结果和上一篇博文相若,而C#和F#无显著区别。但是,C++/CLI虽然同样产生IL,于括管的.Net平台上执行,其渲染时间却只是C#/F#的55%左右。为什么呢?使用ildasm去反汇编C++/CLI和C#的可执行文件后,可以发现,程序的热点函数Sphere.Intersect()在两个版本中,C++/CLI版本的代码大小(code size)为201字节, C#则为125字节! C++/CLI版本在编译时,已把函数内所有Vec类的方法调用全部内联,而C#版本则使用callvirt调用Vec的方法。估计JIT没有把这函数进行内联,做成这个性能差异。另外,C++/CLI版本使用了值类型,并使用指针(代码中为引用)作参数传送。若把C#的版本的Vec方法改写为:

1

2

3

4

5

6

7

8

9

//class Vec

//{

//public static Vec operator +(Vec a, Vec b)

//}

structVec

{

voidAdd(refVec a,refVec b,outVec c);

}

那么,struct不用GC,同时ref/out不用复制,其性能会比较高。但是代码会变得很难看:

1

2

3

4

5

6

7

// 原来用运算符重载(operator overloading):

a = b * c + d;

// 改用ref/out

Vec e;

Vec.Mul(refb,ref, c,oute);

Vec.Add(refe,refd,outa);

为了维持让语言"正常"的使用方法,本实验不采用这种API风格(更新:加入了C#_outref测试,詳見文末)。

然而,托管代码(C++/CLI)的渲染时间,仅为原生非括管代码(IC++)的1.91倍,个人觉得.Net的JIT已经非常不错。

另一方面,Java的性能表现非常突出,只比C++/CLI稍慢一点,Java版本的渲染时间为C#/F#的65%左右。以前一直认为,C#不少设计会使其性能高于Java,例如C#的方法预设为非虚,Java则预设为虚;又例如C#支持struct作值类型(value type),Java则只有class引用类型(reference type),后者必须使用GC。但是,这个测试显示,Java VM应该在JIT中做了大量优化,估计也应用了内联,才能使其性能逼近C++/CLI。

纯C++方面,Intel C++编译器最快,Visual C++慢一点点(1.19x),GCC再慢一点点(1.32x)。这结果符合本人预期。 Intel C++的OpenMP版本和单线程比较,达5.16加速比(speedup),对于4核Hyper Threading来说算是不错的结果。读者若有兴趣,也可以自行测试C# 4.0的并行新特性。

动态语言组别

首先,要说一句,Google太强了,难以想像JsChome的渲染时间仅是IC++的16.12倍,C#的4.94倍。我有信心用JavaScript继续写图形、物理方面的博文了。

以下比较各动态语言的相对时间,以JsChrome为基准。 Chrome的V8 JavaScript引擎(1.00x)大幅抛离Firefox的SpiderMonkey引擎(15.09x)。而LuaJIT(3.49x)和Lua(5.16x)则排第二和第三名。 Lua的JIT版本是没有JIT的68%,并没有想像中的快,但是也比Python(16.48x)快得多。曾听说过Ruby有效能问题,没想到问题竟然如此严重(327.31x),其渲染时间差不多是Python的20倍。

我认为,本实验中,不同语言的性能差异,并非在于数值运算,而是对象生成及函数调用。我使用Python内建的profiling功能:

相关新闻

  • 由此Prototype开发者搞了一个非常有名的函数出来,bind!以下是它的一个最简单的版本:
  • PyTorch DataLoader 高级配置:5个核心参数详解与多进程加载避坑指南
  • POSIX 1003.1 标准解析:从 fork/exec 到 72 个系统调用的可移植性实践

最新新闻

  • Redis 突然变慢了如何排查并解决?
  • 144、结构化输出:JSON Mode、Function Calling、Grammars 三种方案对比
  • VirtualBox+Kali+Genymotion:搭建移动安全渗透测试实验环境
  • 2026最新7款AI编程工具实测 基础版免费深度对比
  • 【光学】高斯光束在F-P干涉仪中的传输模拟附matlab代码
  • 用Ai开发微信小程序,没想到那么简单(一)

日新闻

  • AI智能体安全防护框架AgentGuard:从原理到实战部署指南
  • KMX63与PIC18F26K40硬件组合及低功耗设计实践
  • 基于YOLO13改进的门体检测模型:C3k2模块与PoolingFormer技术解析

周新闻

  • 基于YOLOv12的番茄成熟度智能检测系统开发
  • 终极RimWorld模组管理指南:用RimSort告别模组冲突烦恼
  • AI Agent框架开发:从理论到实践的完整指南

月新闻

  • 2026年6月公司网站搭建最新热门渠道测评:四大低成本/零代码平台对比+避坑
  • 【Linux】Linux arm 编译QT程序,出现expected “}“报错
  • 【MATLAB例程】四基站二维AOA定位与距离辅助增强对比仿真。基于角度观测和测距修正的固定目标平面定位精度分析

关于尧图

  • 公司简介
  • 团队介绍
  • 企业文化
  • 荣誉资质

服务项目

  • 定制开发
  • 电商建站
  • UI 设计
  • 运维服务

快速链接

  • 案例展示
  • 建站流程
  • 常见问题
  • 资讯中心

联系方式

  • 📍北京市朝阳区互联网产业园 A 座 10 层
  • 📞400-888-8888
  • ✉️contact@rkmt.cn
  • 🕐周一至周日 9:00-21:00

© 2024 北京尧图网络科技有限公司 版权所有 | 京 ICP 备 XXXXXXXX 号