业界首款!美光推出低功耗压缩附加内存模块:速率最高9600MT/s
2024-05-17 3216510
2023-09-01 0
一、前言:AI领域不应忘记Intel的存在
今年最为火爆的产业无疑就是AIGC,也就是以AI为主导的生成式内容,包括ChatGPT、AI画图、AI作诗等功能。可以说,只能玩游戏而不支持AIGC的显卡已经不符合时代的需求。
如今NVIDIA 在AI时代一飞冲天,可能会让很多同学误认为只有NVIDIA显卡才支持Stable Diffusion这类的AI应用。
但事实上,还有一家厂商对于AI的投入力度并不逊于NVIDIA,而且在多年前就开始布局AI,它就是芯片巨头Intel公司。
在即将上市的14代酷睿Meteor Lake处理器中,就设计了VPU(Visual Processing Unit)AI单元,这将是Intel首次在CPU中放入独立的AI硬件单元。集成在CPU内部的好处就是能够拥有极低的延迟,在处理一些低负载AI时要优于GPU。
更令人想象不到的是,VPU还能对Stable Diffusion提供硬件加速,无需昂贵的独立显卡。这也就意味即将上市的14代酷睿轻薄本将会以更加完整的姿态的拥抱AI。
为了让更多的Intel用户也能体验到AI,Intel还推出了AI 应用 Demo ”英特尔大语言模型“,它可以帮助处理一些日常生活以及工作中的一些任务。
这个Demo特别对混合架构的第12/13代酷睿处理器进行了优化,也就是市面上主流的Intel处理器轻薄本就能直接运行,并且会有相当棒的体验。
不止CPU, 在GPU领域Intel也做了非常多的努力。年初,Intel推出了基于OpenVINO,AI绘图开源模型Stable?Diffusion可以使用开源图片编辑软件GIMP,让Intel Arc GPU能通过输入关键词实现创意绘图。
不久之后,Intel又推出了基于OpenVINO PyTorch后端的方案,能让Arc A770/A750 GPU直接支持Stable Diffusion WebUI,并且在加速能力方面远强于同价位的NVIDIA GPU。
下文中我们将会进行对比测试,让大家能更为直观的了解Intel Arc GPU的AI性能。
二、英特尔大语言模型体验:13代酷睿轻薄本轻松搞定
这里我们选择了一台通过Intel Evo认证的轻薄本-- ThinkPad X1 Yoga来进行测试,它搭载的是Intel 酷睿i5-1340P处理器。
英特尔大语言模型应用拥有”聊天助手“、”情感分析“、”中文翻译“、”故事创作“、”生成大纲“、”信息提取“、”美食指南“、”旅游规划“等八大模块,并且还有写代码的能力。
在”聊天助手“中,我们尝试让AI写一首关于安史之乱的七言律诗,虽然结果并不算好,但仍有部分诗句让人眼前一亮,可作为创作借鉴。
”生成大纲“功能,你只需要说出自己想写怎样的作品,AI就会给你一个故事大纲。
”中文翻译“可以翻译一段中文,而且你的提问,AI也是用英文回答。
其他功能模块,有兴趣的同学可以自行摸索体验。
三、Stable Diffusion出图测试:Arc A770 16GB大幅领先RTX 4060
目前Windows端的Stable Diffusion WebUI大多是采用”绘世“启动器,不过可惜的是这款启动器目前只支持NVIDIA GPU,AMD GPU根本无法识别,Intel Arc GPU可以被识别,但却无法启用硬件加速。
因此想要使用Intel显卡来加速Stable Diffusion,需要运行在Linux环境下才能实现。
当然,也并不是说必须得安装一个Linux系统,更简单的途径是使用Docker(容器)。
本次我们的测试即是基于Docker版Stable Diffusion WebUI,参与测试的显卡包括A/I/N三家的4款2000元价位甜点显卡。
可以看到,Arc A770 16GB的确可以支持硬件加速,GPU利用率99%,显存占用超过了8GB,功耗也跑满了190W TGP。
为了将显存占用控制在8GB之下,以便让其他显卡也能顺利测试,我们将出图分辨率设置为640*480。
测试结果多少还是让人有一些意外。
如果从游戏性能表现来看,RTX 4060比2张Arc GPU都要强不少,但是Stable Diffusion出图更依赖显存,这方面RTX 4060由于被阉割的比较厉害,特别是显存位宽只有128Bit,容量也只有8GB,因为并不是特别适合用来加速Stable Diffusion。
AMD这边,虽然RX 6700 XT拥有12GB大容量显存、192Bit位宽,但由于AMD目前对AI支持力度不够,导致旗下GPU在这方面的表现不尽如人意。
两张Intel GPU的表现有些超越预期,就算是定位更低的Arc A750成绩也与 RTX 4060接近。Arc A770的表现更是大幅超越了对手,领先幅度高达20%。
另外,我们这是限制了出图分辨率。如果使用更高分辨率,或者安装一些其他插件进行AI画面修复,8GB显存是远远不够的,Arc A770 16GB的优势也会更大。
四、总结:AI画图不妨考虑2000元的Intel Arc A770 16GB
此前,当有同学让我推荐能跑AI的显卡时,我会根据预算推荐对应的N卡,但如今的话,我也会考虑I卡。
众所周知,Stable Diffusion对于显存容量和速度有非常苛刻的需求,8GB及以下容量显存会有非常多的限制,比如使用高分辨率出图。
因此,想要认真玩AI画图,16GB或者24GB显存会带来更多的玩法和更好的体验,这也导致了二手RTX 3090 24GB显卡的热销。
当然,即便是2手RTX 3090,其价格也不是普通消费者能够承受的。
纵观当前的GPU市场,Intel Arc A770 16GB可以说是专为AI而生的显卡。这款显卡以低于RTX 4060的售价,提供了后者2倍的显存容量和显存位宽,可以一定程度上治疗好AI玩家的Stable Diffusion显存焦虑症。
虽然Arc A770 16GB游戏性能与RTX 3060处于同一水准,但其AI出图的加速性能却比RTX 4060还要强20%以上。
相比之下,NVIDIA拥有16GB显存的显卡型号相对较少而且售价高昂,比如RTX 4080高达9000元的售价让不少AI玩家望洋兴叹。即便是不久前推出的RTX 4060 16GB,其售价也在4000元左右,几乎2倍于Arc A770 16GB。
因此,对于预算不足的AI玩家来说,Intel Arc A770 16GB在性价比方面的确胜多大多数显卡。
至于AMD,其AI之路还很漫长!
另一方面,AI应用往往都需要强大的算力,而性能并非轻薄本的优势,所以很少有人会把轻薄本和AI联系起来。
Intel则让我们看到了不一样的一面,配备13代酷睿P系列的Evo认证轻薄本上,英特尔大语言模型可以运行得非常流畅,无论写诗、翻译,还是写代码,抑或生产力辅助,都能快速给出相当有帮助的结果,可以大大提升工作效率。
无论是日常办公,还是外出差旅,随手拿出便携的Evo轻薄本,都可以完成一些轻负载的AI推理工作,这在以往可是不敢想象的。