快手于冰：抓住平台基因，在AI大模型领域重度投入

8月8日消息，近日，快手高级副总裁、研发线负责人于冰表示，AI 大模型作为当下最重要的革命性技术，进入爆发期，有望开启AGI时代，而多模态内容生成与理解是其核心能力。

于冰认为，当前，多模态AI大模型因其在文本、代码、图像和视频等多种内容上突出的生成与理解能力，有望为视频生产、理解、分发、消费等全链路打开新的技术视角，突破传统音视频编码的技术天花板，突破基于用户行为的搜广推算法的传统思路，将视频内容创作从PGC、UGC带动进入AIGC时代，创造AI大模型驱动的视频内容创作工具，激发创作者的创意空间，高效率、低成本地生产高质量的视频内容。

快手于冰：抓住平台基因，在AI大模型领域重度投入-风君雪科技博客

而短视频、直播作为最典型的多模态媒介，快手也抓住平台基因，在AI大模型领域重度投入，全方位探索技术突破。于冰介绍，目前，快手在AI大模型的布局体系分为三个层级：基于具备高性能、高并发、高算力的“大基建”，构建快手多模态的AI“大模型”，进而在搜广推、内容创作、用户增长、研发效能等领域内打造“大应用”。

他提到，在多模态 AI大模型的加持下， AI技术和工具可全方位地赋能影视创作者，助其在创作、拍摄、后期等各阶段激发创意、提升效率和内容质量，影视制作的周期也能大幅提高，过去花费数年拍摄的大片有望数月完成。

快手自2011年成立至今，回顾过往经历，于冰表示，业务发展会经历入局、成长、成熟等多个阶段，在业务发展的不同阶段，快手所采取的研发策略也各有侧重。创新成长期更注重持续投入，探索新产品、新周期；而成熟阶段则需聚焦优化效率，兼顾体验，既保证产品体验的竞争力，又保证业务的稳健成长。

于冰以快手音视频业务为例，目前该业务已步入成熟期，研发策略重点也转移至提升效率、优化成本，追求单位成本下算力、存储和网络使用效率的提升。快手基于自研视频质量评估KVQ、视频增强修复KEP和KRP、视频压缩编码算法KVC等一系列核心技术，形成数据驱动的视频处理闭环，在兼顾体验的同时极致压缩视频。

2022年，快手技术toB业务StreamLake推出了首款自研智能视频处理芯片SL200，该芯片集成了快手领先的视频编解码、图像处理、AI推理、内容自适应编码等关键技术，具备高质量、高密度、智能化的特点。目前，SL200芯片已全面应用于快手的直播和短视频业务，实现成熟技术通过StreamLake对产业赋能。

而在数字人领域，于冰介绍，快手全链路自研了光场扫描重建、超写实人像建模、智能绑定、动作捕捉与驱动、物理仿真等数字人核心技术，推出「快手虚拟演播助手（KVS）」和「快手智播」两大解决方案。未来，结合智能编曲、图像/视频生成、LLM等AI能力，快手数字人技术将继续在文旅、教育、游戏、直播电商等领域广泛应用，助力客户打造高品质低成本的3D和2D数字人。（一橙）