
云开体育全站app
12 月 5-6 日,2024 中国生成式 AI 大会(上海站)「GenAICon 2024」将在上海中星铂尔曼大旅舍遍及举办。中国生成式 AI 大会已奏效举办两届,速即成长为国内生成式 AI 规模最具影响力的产业峰会之一。
这次亦然中国生成式 AI 大会初度登陆上海举办,由智一科技旗下智能产业第一媒体智东西、AI 与硬科技学问共享社区智猩猩共同发起。上海市东谈主工智能行业协会为本次大会的教唆单元。
大会上海站以"智能跃进 创造无尽"为主题,将配置"主会场峰会 + 分会场计划会 + 展览区"。其中,主会场将进行大模子峰会、AI Infra 峰会,分会场将组织端侧生成式 AI、AI 视频生成和具身智能三场时刻计划会。主会场与分会场外则设有展览区。
50+ 位嘉宾将在大会上带来致辞、演讲、论说和对话商议,以前瞻性视角为寰球解构和把脉生成式 AI 的时刻产物鼎新、贸易落地解法、畴昔趋势走向与前沿研究焦点。
当作大会上海站的三场时刻计划会之一,AI 视频生成时刻计划会将在第二日上昼的分会场进行,由主题论说和圆桌 Panel 两个顺序构成。
Sora 自年头问世以来,AI 视频生陋习模穷途末路,到年末来看,国表里齐已是华夏逐鹿的地方。尽管如斯,依旧有不少紧迫问题有待措置。现在,从学术界到工业界,齐在奋力于措置 AI 视频生成尚未措置的问题,以期为视频生成大模子及应用产物带来更优质的体验。
一、上海站三场计划会之一,完好议程公布
现在,AI 视频生成时刻计划会邀请到中存算董事长陈巍,上海交通大学东谈主工智能研究院助理训诲晏轶超,新壹科技 AI 算法主任架构师李璋,井英科技联系首创东谈主、CTO 王健,旷视研究院高级研究员李华东 5 位后生学者和时刻行家带来论说,将围绕视频大模子架构相比、三维数字东谈主视频生成、面向数字东谈主生成的视频垂直大模子、AI 短剧时刻冲破、可控东谈主物视频生成伸开锤真金不怕火。
视频大模子(VLM)正与短视频产业取悦并迎来新爆发点。中存算董事长陈巍将围绕《视频大模子架构对等到长序列模子加快》这一主题,从视频生成大模子与寰球模子的视角开赴,对比主流架构(如 NaViT、RADM),探讨内存墙和通讯墙对视频大模子 GPGPU/TPU 集群磨真金不怕火和部署的挑战,并共享算力芯片级磨真金不怕火部署的措置决策和系统教养。
三维高斯、大模子等时刻在昔时一年快速发展,并与数字东谈主时刻进行了平庸取悦。上海交通大学东谈主工智能研究院助理训诲晏轶超将带来主题为《先验指挥的三维数字东谈主视频生成》的论说,从数字东谈主重建、生成与裁剪等标的先容三维数字东谈主视频生成的最新发挥,并探讨三维数字东谈主时刻的发展趋势。
在生成式 AI 时刻的鼓动下,智能数字东谈主已成为内容创作的紧迫标的。新壹科技 AI 算法主任架构师李璋将围绕《视频垂直大模子在智能数字东谈主生成中的应用》,先容从通用大模子到垂直大模子的时刻演进,锤真金不怕火新壹视频大模子在数字东谈主视频生成中的中枢时刻冲破,并深远分析何如结束当然语言启动的动作与色调生成,还将展示其在相关规模的典型应用案例。
近期,井英科技通过视频生成模子结束了 100 分钟以上短视频的制作,并奏效结束了用户付费不雅看的贸易模式。公司联系首创东谈主、CTO 王健将在这次论坛上将共享 AI 短剧从领先的不行行到现如今可行的要害时刻冲破,主题为《AI 短剧拐点背后的时刻冲破》。
跟着短视频、影视和游戏动画的快速发展,传统的视频制作模式因耗时耗力而逐步露出局限性。视频生成大模子算法为高效生成高质料视频提供了新选拔,但现存算法的生成内容可控性不及。旷视研究院高级研究员李华东将以《可控东谈主物视频生成》为主题,先容支合手混杂模态限制的东谈主像视频生成算法 MegActor 系列责任。
主题论说顺序收尾后的圆桌 Panel,将由中存算董事长陈巍,上海交通大学东谈主工智能研究院助理训诲晏轶超,井英科技联系首创东谈主、CTO 王健,以及旷视研究院高级研究员李华东一齐带来。
二、五位学者行家多维度锤真金不怕火 AI 视频生成
1、中存算董事长 陈巍

陈巍博士,大模子 +AI 芯片行家,高级职称,中存算等企业董事长。国际计较机学会(ACM)、中国计较机学会(CCF)专科会员,多个国际东谈主工智能期刊审稿东谈主。主要研究标的为大模子架构、稀疏量化压缩与部署加快,存算一体与 3D Chiplet 处理器,相关时刻后果已被平庸应用于闻名 IDC 和互联网企业。
曾任规模闻名东谈主工智能(当然语言处理)企业首席科学家,中国科学院副主任(2012),多个国度科技紧要专项课题认真东谈主。中国与好意思国发明专利软件文章权约 70+ 项(约 50+ 项发明专利已授权)。著有《Sora 大模子时刻精要—旨趣、要害时刻、模子架构与畴昔趋势》《GPT-4 大模子硬核解读》《ChatGPT 大模子时刻精要—发展历程、旨趣、时刻架构详解和产业畴昔》《智能网联汽车:激光与视觉 SLAM 详解》等。
论说主题:《视频大模子架构对等到长序列模子加快》
内容节录:跟着大模子时刻的快速发展,视频大模子(VLM)正与短视频产业取悦并迎来新的爆发机遇,逐步成为互联网应用的热门。
本次共享从视频大模子与寰球模子的角度,对比主流视频生成大模子架构,探讨视频生成的要害时刻(包括 NaViT、RADM 等),分析视频生成类大模子的主要挑战与发展趋势;探讨内存墙(Memory Wall)和通讯墙对视频大模子 GPGPU/TPU 集群磨真金不怕火和部署的挑战,并针对这类视频长序列模子的算力芯片级磨真金不怕火部署,取悦具体款式给出软硬取悦的措置决策与系统教养。
2、上海交通大学东谈主工智能研究院助理训诲 晏轶超

晏轶超,上海交通大学东谈主工智能研究院助理训诲,博士生导师。获上海交通大学电子工程系学士、博士学位,法国里昂中央理工学院硕士学位,曾担任阿联酋发祥东谈主工智能研究院研究科学家。主要研究标的为 AIGC 及三维数字东谈主时刻,发表包括 TPAMI、CVPR、NeurIPS 在内的论文 40 余篇。先后主合手国度当然科学基金后生款式、CCF- 阿里巴巴后生科学家基金等款式 8 项。曾入选上海市外洋高等次东谈主才计划,获 2020 年度中国图象图形学学会优秀博士论文奖。
论说主题:《先验指挥的三维数字东谈主视频生成》
内容节录:"东谈主"一直是视频生成的中枢对象,面对大规模视频的生成需求,欺骗生成式东谈主工智能时刻产生高拟真,规模化的杜撰数字东谈主正逐步成为研究热门。三维高斯、大模子等时刻在昔时一年快速发展,并与数字东谈主时刻进行了平庸取悦,本次论说将从数字东谈主重建、生成、裁剪等标的先容数字东谈主视频生陋习模的最近发挥,对三维数字东谈主时刻的发展趋势进行探讨。
3、新壹科技 AI 算法主任架构师 李璋

李璋,领有中国科学院软件工程硕士学位,是生成式东谈主工智能规模的资深时刻行家。在深度学习、算法优化以及大模子研发方面具有深厚的表面基础和丰富的实战教养。在新壹(北京)科技有限公司担任 AI 算法主任架构师,主导揣测打算并研发了多个具有行业美艳性的 AI 款式。揣测打算与研发了"新壹视频大模子"——国内首个专注于视频生成的生成式 AI 大模子。该模子在视频内容生成、判辨与优化方面得到了冲破性后果,为鼓动国内生成式 AI 时刻在视频规模的骨子应用提供了强有劲的撑合手。
论说主题:《视频垂直大模子在智能数字东谈主生成中的应用》
内容节录:在生成式 AI 时刻高贵发展的布景下,智能数字东谈主已成为内容创作、杜撰助手和东谈主机交互等规模的紧迫应用之一。但是,传统生成模子在高精度、多模态的智能数字东谈主生成中仍濒临诸多挑战。为此,垂直规模的大模子提供了一条全新旅途。
本次演讲,开头会先容从通用大模子到垂直大模子的演进,之后将介怀锤真金不怕火新壹视频大模子的举座架构揣测打算偏激在数字东谈主视频生成与优化中的中枢时刻冲破;此外,还将对智能数字东谈主生成的时刻难点,包括数字东谈主生成中结束当然语言启动动作与色调生成的要害时刻等进行深远分析,并共享视频垂直大模子启动的智能数字东谈主在相关规模的典型应用案例。
4、井英科技联系首创东谈主、CTO 王健

王健,井英科技联系首创东谈主,CTO,国内视频生成模子的首批创业者,从 2020 年起专注于视频生成模子及相关应用。在参与创立井英科技之前,担任触宝科技联系首创东谈主、CTO,是触宝输入法主创,当然语言模子行家。
论说主题:《AI 短剧拐点背后的时刻冲破》
内容节录:自本年 2 月 OpenAI 发布 Sora 起,视频生成大模子成为了热门标的。但其具体落地的业务场景却一直不解确。近期,井英科技通过视频生成模子结束了 100 分钟以上短视频的制作,并奏效结束了用户付费不雅看的贸易模式。本次共享将先容 AI 短剧从领先的不行行到现如今可行的要害时刻冲破,并探讨了除视频生成大模子除外的其他要害时刻发挥。
5、旷视研究院高级研究员 李华东

李华东,旷视研究院高级研究员,硕士毕业于清华大学计较机系。研究标的为计较机视觉,主要包括视频生成与判辨,深度揣测等,已在 ECCV,AAAI 等东谈主工智能顶级会议上发表多篇论文。
论说主题:《可控东谈主物视频生成》
内容节录:短视频、影视和游戏动画创作正在速即发展。但是,传统的视频制作历程耗时耗力,经常需要多数的东谈主工后期裁剪。视频生成大模子算法提供了一种低本钱、高效的高质料视频内容生成措置决策。但视频生成算法生成的内容可控性不及,截至了其骨子应用的有用性。因此,何如结束视频生成内容的可控性一经一大要害挑战。
在本次论说中,我将先容 MegActor 系列责任,这是一种支合手混杂模态限制的东谈主像视频生成算法。该算法支合手变装自界说(包括真确东谈主物、二次元东谈主物和游戏东谈主物等),并或者通过视频、音频和文本输入结束单独和混杂限制。其功能涵盖了限制变装语言、唱歌和生成色调养画等。MegActor 系列是社区内的首个开源可控东谈主物视频生成大模子,将合手续优化以鼓动时刻的不停发展。
三、中国生成式 AI 大会上海站日程
云开体育全站app
