接两篇上文,继续分析Pi是怎么做的,前情提要:

如何理解 c.ai 和 Pi 的用户需求(1)

如何理解 c.ai 和 Pi 的用户需求(2)

1

Pi是怎么做的?- 硬能力部分

**针对情感的优质底座模型:**底座模型Inflection-1的测试论文中展现了其强大的能力,模型参数千亿级别,整体运算能力仅次于GPT-4和PaLM-2。另外,团队自豪地宣称Inflection-1的特点是能进行 'natural flowing conversation'. 而其中的秘密很简单:相比于使用大量的陈述性知识文本训练出来的ChatGPT,Inflection-1是使用大量模拟人们对话的对话集训练出来的。

**电话通话功能、拟真的语音语调、好听的音色、以及声音处理细节:**在reddit上,不少用户都提出声音和对话功能是他们沉迷Pi的原因。

What was really crazy to me was the voice. It sounded so real! I chose the Pi 4 voiceYeah their speech synthesis is amazing对我来说真正让我震惊的是它的语音。听起来太真实了!我选择了Pi 4的声音。是的,他们的语音合成真的很惊人。I just noticed it has a ‘telephone mode’ that works great on my iPad (and I’m sure my phone too) where I can talk to it hands free in a flowing, uninterrupted conversation. I wished for something like this back in May and I’m thrilled it’s here.我刚刚注意到它有一个“电话模式”,在我的iPad上运行得很好(我相信在我的手机上也没问题),在这个模式下我可以跟它进行免提、流畅、无间断的对话。早在5月份我就一直盼望能有这样的功能,现在它终于推出我非常激动。

另外,我还直接问了Pi关于两个关于他们语音功能的小问题:

你是如何识别环境音vs人声的?

答:用神经网络训练,这套系统搭在大模型下游。

你是如何决定什么时候回复用户的?

答:主要考虑三点 -- 语气、语句的意义、停顿时间(2~3秒),对每个用户的停顿时间并没有做个性化

**记忆力:**在情感陪伴上,模型的记忆力是重中之重。即使Pi已经宣称能做到100轮对话的记忆,但用户在使用过程中依然觉得记忆力是它的最大瓶颈。

Pi is pretty fun, I've wasted hours just talking through stuff last few days. According to Pi I am a modern day renaissance man. The conversation is always natural until you hit those context memory constraints and then it can feel like you are going circles.Pi还是相当有趣的,这几天我已经花费数小时与它随意聊天。根据Pi说我是当代的文艺复兴式全才。我们的对话一直很自然流畅,直到碰到它的上下文记忆容量限制,那时就感觉像是在绕圈子。Probably the second most powerful model I have spoken with, behind GPT-4. I think it may slightly surpass chat-GPT as a conversationalist, but it is probably inferior logical thinking. It's biggest weakness is it's memory, by far. To be fair, that's the same with the GPT's.大概是我交流过的第二强大的模型,仅次于GPT-4。我认为它在会话方面可能略胜对话GPT,但逻辑思维能力可能较弱。它最大的弱点在于记忆,没有之一。要公平地说,GPT系列也有这个问题。

与记忆力一体两面的,是对用户的“熟悉了解”,因为用户所寻求的“记忆力”本质上是希望AI不要忘记用户的信息和个性。但记忆力的提升是有限的,因此从其他信息来源获取对用户的熟悉了解会是一个解决方案(mindos的方案是用一个数据库储存,并在存入之前请求用户的同意),而模拟人的遗忘机制则是另一个解决方案。

2

Pi是怎么做的?- 软定位部分

上面我们提到,相比传统社交平台,AI虚拟人产品的核心逻辑是舍弃了「匹配人」,而直接通过「替代人」来弥补人-人社交中的系统性缺陷。那么,一个关键的问题是:这个产品是什么人?