人工智能正在侵蚀人们的社交互动,但有一款产品试图用AI来修复这一问题。
想象一下,在一个社交应用上刷到一张完美的个人头像,点开主页后发现自我介绍既幽默又真诚。
发送消息给对方,却在瞬间收到回复,字里行间恰如其分。
然而,这种“完美”背后隐藏着一丝冷淡的意味,不禁让人质疑:这张照片是通过技术手段生成的吗?这段话是由AI代理撰写的吗?
当下,可以通过修图软件修饰照片、合成视频以及让AI实时润色文字,社交产品的基本假设——信息的真实性正在瓦解。
在这样的背景下,一款名为“森森”(Gensen)的产品给出了一种反常识的解决方案。今年春节期间,“森森”的声音匹配功能使它在iOS社交榜单上迅速攀升至前20名,月活跃用户突破了260万大关。

“森森”的创始人李哲羽曾在暴雪娱乐参与《魔兽世界》项目的开发,并在皮克斯(Pixar)贡献过多个动画项目的经验。他坚信:
唯有声音无法被AI轻易替代,是人们之间真实交流的最后信号。
通过修图软件修饰照片、合成视频以及利用AI实时润色文字,你在社交应用上看到的人可能并不是真实的自己。
过去十年间,社交产品的匹配逻辑经历了多次变化:陌陌依赖地理位置信息进行配对,Tinder则依靠视觉识别来推荐合适的人选,而Soul则侧重于用户标签的匹配。
不管是哪种方式,所有的产品都基于一个核心假设——用户提供的信息是可信的。
然而,这一假设正在被现实动摇。
由于如今的信息载体正逐渐失去其原本的信任度,人们开始质疑:如果展示型信息越来越不可信,社交匹配还能依赖哪些数据?
在这种情况下,“森森”提供了一种不同的解决方案——通过声音来进行用户间的匹配。
“森森”的创始人李哲羽说:
问卷测试只能反映你想成为的人,而声音能揭示你真实的样子。我们选择相信声音的真实性。
李哲羽曾参与《魔兽世界》的开发,在皮克斯工作期间也贡献了多个动画项目的经验积累。
经过长时间思考,“什么让人与人产生真正连接”这个问题的答案是:不是展示自己,而是共同经历一件事。
在这种“一起经历”的过程中,声音成为了最真实的信息载体。
一个人说话的语调、节奏以及笑声的频率等副语言信号往往比言语本身更能透露出关于这个人的真实信息。这些信号即时产生且无法被伪造或编辑。
“森森”产品的核心理念就是:
利用游戏创造真实互动场景,通过声音捕捉行为特征,并使用AI建模人格特质。
这些副语言信号在沟通中扮演着重要角色,它们往往比言语本身更能反映一个人的性格与情绪状态。
当今大学生常常提到一个词:“营业”——指的是他们在社交应用上精心挑选照片、编辑自我介绍等行为。
开启一款社交软件时,“又要开始营业了”的心理负担成为了常态。这种过程更像是经营一种理想的形象,而非专注于了解和结识某个人。
这种疲劳感并非特定于某一产品的问题,而是整个“展示型社交”模式的结构性缺陷所导致的结果。
如果社交的基础是“展示自己”,那么它不可避免地会变成一种劳动。而在AI时代,这种劳动显得更加荒诞不经——因为双方都在努力经营着精心策划的形象,并可能借助了AI的帮助。
然而,年轻人并非不想参与社交活动,他们只是厌倦了这种表演式的互动方式。
为什么是声音?
在线下的剧本杀、狼人杀或派对游戏中,同样的群体可以轻松地玩一整晚并结识新朋友。为什么?因为在游戏环境中不需要“营业”,只需要做真实的自己。
“森森”的理念就是让用户在其中无需展示自我形象,而只需提供一个场景让他们自然展现真实的一面。
用户可以在“森森”中随意进入任意一款3D语音派对房间,并与陌生人一起玩游戏——如“森森酒馆”、“海龟汤”、以及“电波同频”等。
这些游戏有一个共同点:都需要用户开口说话,表达观点和情绪。
在社交应用上展示的是你想让别人看到的样子;而在游戏中展现的则是你的本能反应——例如推理方式、表演策略或对一个词的直觉感受。这些都无需“演”,因为游戏本身就在要求真实的参与。
“森森”利用语音环境来完成这一切。
有趣的是,“森森”并没有回避技术,而是将AI用于了完全不同的方向——提升互动匹配效率而非包装用户形象。
很多产品使用AI帮助用户“包装自己”,比如AI修图和生成开场白。而“森森”的重点在于如何利用技术来提高互动本身的匹配质量。
在确保用户授权及隐私保护的前提下,系统会对语音交流中的匿名化特征信号进行统计建模,主要包括表达方式相关的声学特征和语言模式两个维度的数据。
这些数据会在不涉及具体语音内容存储的情况下被训练分析,形成更加贴近真实互动风格的匹配参考。
对于用户来说,这一切都不需要额外操作。你只需参与游戏互动,系统便在后台不断优化匹配体验,帮助用户更容易遇到聊得来的人。
李哲羽表示,“我们不是简单的语音聊天室加小游戏。我们的目标是通过AI理解人的声音特性,用游戏暴露性格特点,并基于此进行个性化的匹配连接。”
想象一下,在一局“海龟汤”游戏中,出题者提出一个问题:“有一匹马去餐馆点了碗鱼汤喝了之后哭了,为什么?”房间里有五名陌生人通过语音提问。
一些人直接切入主题询问细节;另一些则从整体角度发问。这种交流方式自然地呈现了参与者的思维方式、表达风格及社交性格。
“森森”正是希望营造这样的场景——让玩家尽情展现真实的自我。
这套逻辑是否有效?用户的实际使用情况已经给出了答案。
今年春节期间,“森森”的iOS社交榜单排名进入前20,月活跃用户突破了260万,估值达到1.5亿美元,并且累计融资超过4500万美元(约3.1亿元人民币)。A16Z和腾讯都表达了投资意愿。
目前,“森森”在中国上海以及美国Palo Alto设有双总部。其美国版Gensen正在做最后的上线准备。

然而,真正值得关注的是这些数字背后的产品结构及其独特性。
派对游戏是一种天然的裂变场景,一个人难以独立完成,必须邀请朋友一起参与。语音互动缩短了“弱关系”转化为“强关系”的路径,AI匹配则确保用户遇到的人真的聊得来。

这三者相结合形成了产品的有机增长循环。
- 回到最初的问题:当照片、视频和文字都失去了可信度时,社交还能剩下什么?
- 在人工智能愈发擅长“生成内容”的时代,理解真实行为或许会成为下一代社交产品最关键的技能之一。
声音可能是这方面的入口,也许这才是社交应有的样子。
对于用户来说,整个过程并不需要额外操作,你无需填写复杂问卷,也无需做性格测试。用户只是参与游戏互动,系统则在后台不断优化匹配体验,帮助用户更容易遇到聊得来的人。
李哲羽表示,“我们不是在做语音聊天室加小游戏。我们在用AI理解人的声音,用游戏暴露人的性格,用性格来匹配连接对的人。”

来看一个具体的用户场景,想象一局海龟汤游戏。
- 出题者说:“有一匹马去餐馆点了一碗鱼汤,它喝完汤就哭了,为什么?”房间里有5个陌生人,开始通过语音提问。
- 有人上来就问:“他是不是之前在海上遇过险?”——这个人思维跳跃,喜欢直达结论。
- 有人从细节入手:“马不会说话,他是怎么点汤的?”——这个人严谨、习惯建立完整边界。
- 还有人说:“这个汤好喝吗?”——全场爆笑,气氛瞬间轻松下来。
短短十分钟,5个陌生人的思维方式、表达风格、社交性格已经自然呈现。这就是森森想做的事情:游戏提供场景,让用户尽情做自己。
这套逻辑是否成立?用户已经用脚投了票。
春节期间社交榜17、MAU 260万、估值1.5亿美元、累计融资超4500万美金(约3.1亿元人民币),A16Z和腾讯已表达投资意向。
目前,森森在上海和Palo Alto设有双总部,美国版Gensen正在做最后的上线准备。
但更值得关注的不是数字本身,而是这些数字反映的产品结构。
派对游戏是天然的裂变场景,一个人玩不起来,必须拉朋友一起。语音互动让“弱关系”到“强关系”的转化路径大幅缩短,AI匹配让你遇到的人真的聊得来。
三者组合,形成了产品的有机增长飞轮。
回到最初的问题:如果AI让照片、视频、文字都失去了可信度,社交还剩下什么?
在AI越来越擅长“生成内容”的时代,理解真实行为或许会成为下一代社交产品的关键能力。
声音,可能是这件事的入口,也许这才是社交本来该有的样子。
