DeepMind 校友推出 Haiper,AI 视频生成竞争愈演愈烈
  三个点 2024年03月08日 898 5

上个月,OpenAI 发布 Sora 模型, AI 视频生成市场因此而变得炙手可热。DeepMind 的两位校友 Yishu Miao 和 Ziyu Wang 公开发布了他们的视频生成工具Haiper,并内置了自己的 AI 模型。
img

苗侨伟曾在 TikTok 的全球信任与安全团队任职,而王先生曾在 DeepMind 和谷歌担任研究科学家,他们于 2021 年开始在该公司工作,并于 2022 年正式成立该公司。

两人都精通机器学习,并开始研究使用神经网络进行 3D 重建的问题。在对视频数据进行训练后,Miao 在一次电话会议中向 TechCrunch 提到,他们发现视频生成是一个比 3D 重建更有趣的问题。这就是为什么 Haiper 在大约六个月前最终专注于视频生成的原因。

Haiper 在由Octopus Ventures领投、 5Y Capital参投的种子轮融资中筹集了1380 万美元。在此之前, Phil Blunsom和Nando de Freitas等天使投资人帮助该公司在 2022 年 4 月筹集了 540 万美元的种子前轮融资。

视频生成服务

用户可以访问 Haiper 的网站,输入文字提示即可免费开始生成视频。不过,它有一定的限制。你只能生成两秒的高清视频和最多四秒的稍低质量的视频。
img

Haiper 面向消费者的网站

该网站还具有动画图像和以不同风格重新绘制视频等功能。此外,该公司正在努力推出诸如扩展视频等功能。

苗先生表示,公司的目标是保持这些功能免费,以便建立一个社区。他指出,在初创公司的发展历程中,考虑围绕视频生成构建订阅产品还“为时过早”。不过,该公司已与京东等公司合作,探索商业用例。

我们使用了 Sora 的原始提示之一来生成示例视频:“几只巨大的猛犸象走过一片雪地草地,它们行走时长长的毛在风中轻轻飘扬,远处是白雪覆盖的树木和白雪皑皑的山脉,午后的阳光、缕缕白云和远处高挂的太阳营造出温暖的光芒,低镜头视角令人惊叹,以美丽的摄影和景深捕捉到了这只毛茸茸的大型哺乳动物。”

构建核心视频模型

虽然 Haiper 目前专注于面向消费者的网站,但它希望构建一个可以提供给其他人的核心视频生成模型。该公司尚未公开有关该模型的任何细节。

Miao 表示,该公司已经私下联系了一批开发人员,让他们尝试其封闭的 API。他认为,随着公司快速迭代模型,开发人员的反馈非常重要。Haiper 还考虑将其模型开源,让人们探索不同的用例。

该首席执行官认为,目前,在视频生成中,重要的是解决恐怖谷问题——一种当人们看到人工智能生成的类似人​​类的形象时会产生怪异感觉的现象。

他说:“我们并不是致力于解决内容和风格方面的问题,而是尝试解决一些基本问题,比如人工智能生成的人类在行走时的样子或雪花飘落的样子。”

该公司目前拥有约 20 名员工,并正在积极招聘工程和营销领域的多个职位。

未来竞争

OpenAI 最近发布的 Sora 可能是 Haiper 目前最受欢迎的竞争对手。不过,还有其他参与者,如谷歌和 Nvidia 支持的 Runway,后者已筹集了超过 2.3 亿美元的资金。谷歌和Meta也有自己的视频生成模型。去年,Stability AI在研究预览中宣布了稳定扩散视频模型。

Octopus Ventures 合伙人 Rebecca Hunt 认为,未来三年,Haiper 必须建立强大的视频生成模型,才能在该市场实现差异化。

“实际上只有少数人有能力实现这一目标;这是我们想要支持 Haiper 团队的原因之一。一旦模型达到超越恐怖谷并反映现实世界及其所有物理现象的程度,就会有一段应用无限的时期,”她在电子邮件中告诉 TechCrunch。

虽然投资者希望投资人工智能视频生成初创公司,但他们也认为该技术仍有很大改进空间。

“感觉 AI 视频已经达到了 GPT-2 的水平。我们在去年取得了长足的进步,但距离日常消费者使用这些产品还有很长的路要走。视频的‘ChatGPT 时刻’何时到来?” 来自a16z的Justine Moore去年写到。

最后一次编辑于 2024年03月20日 0

暂无评论

三个点
作者其他文章 更多