新闻资讯

新V观海外:谷歌NotebookLM突围ChatGPT形态路线

2024-10-04 17:44:47

  

新V观海外:谷歌NotebookLM突围ChatGPT形态路线

  NoteBookLM这次更新的多模态新功能其实并非首次出现。在谷歌实验室的其它产品中已经出现过YouTube在线视频总结功能■◆◆★,而不久前的Google Illuminate产品也发布过将PDF学术文档转成两人对话音频文件的功能。

  NotebookLM是谷歌实验室(Google Labs)此前已经推出的AI笔记产品。主要功能是用户上传PDF等格式的文档★★■,或者直接输入谷歌在线文档、在线幻灯片★★■■、网页等网址,然后通过AI进行内容总结。用户可以自行提问★■■,让AI针对上传的文档或输入的在线文档内容进行回答。

  尽管在我实际使用开源版Open NoteBookLM的过程中,发现它的生成结果并没有谷歌NoteBookLM那么稳定,且排队等待时间长达5至10分钟■★。但Open NoteBookLM的快速出现至少可以佐证★◆■★,多模态新功能是很快能被开源界所追上的★■◆。

  谷歌的AI笔记产品NotebookLM最近新增了处理音频视频文件的功能。随后,这次产品更新获得了前OpenAI创始团队成员Andrej Karpathy关注◆◆★★,认为它给人一种当年ChatGPT出现的相似感,可能会开启新的AI模型产品形态■◆★。

  既然在功能层面的独创性不足★★◆■★,那为什么NoteBookLM这次更新还会引发诸多业界关注■◆,甚至与当年ChatGPT的出现相提并论◆★?这或许是因为NoteBookLM可能会启发AI应用的新路线。

  特别是在NoteBookLM此次更新多模态功能后不久■■★,新加坡政府科技局(GovTech)的Gabriel Chua很快在HuggingFace上推出了开源版Open NoteBookLM★◆,使用了开源模型Llama 3.1-405B和文本转语音框架MeloTTS◆★◆★◆★,实现了将PDF转成对话音频文件的核心功能■■★■◆,而且在生成音频的语言风格和时长方面提供了更多选项◆◆■◆,且能够支持中、英■■◆★★、法、日、韩、意等多种语言★◆■◆★。

热门推荐

2024-10-04

   ...

2024-10-04

   ...

2024-10-04

  企业网站已跃升为展示企业风采...