“我们第一次见面是在 2023 年 10 月 14 日的黑客马拉松上,从那时起我们就一直在那里。 能够参与到这个团队中来,也说明我们在其中有一定的共识,我们无一例外地选择做这件事。 ”
Soundbridge 团队的前端开发者唐轩提到了团队成员李鹏程的一个诉求:AI 能不能用来帮助听障人士学会说话?因为很多听障人士想通过**老师“学说话”,每个月至少需要5000元,他很认真地说,很多人负担不起。
由于遗传原因,来自内蒙古的李鹏程在出生时就失去了听力。 虽然儿子被诊断出重度耳聋,但李鹏程的母亲还是希望他提高教育水平,于是带他去北京读书。
初中毕业后,由于学校地位等客观原因,母亲不得不带着李鹏程离开北京,经过几轮让他读高三。 不幸的是,由于学生档案问题,李鹏程未能参加高考,学历止步于高中。
进入社会后,李鹏程发现以自己的学历和身体条件很难找到工作,于是决定自力更生。 在父母“赞助”的5000元创业**的帮助下,他在一个月内为听障高中开发了5门在线课程,帮助30多名高中生学习了一些技能。
(图片:《寂静的雪》。
然而,资金很快就用完了,合资企业也走到了尽头。 后来,他关注科技和AI对听障人士的帮助,将目光投向了手语转文字、虚拟数字人等项目,但由于种种问题,均未成功。
2024年,重庆的一家科技公司展示了与李鹏程相似的概念。 他立即前往重庆加入公司,在那里他为听障社区策划并举办了许多活动,参与者超过2000人。
2024年,李鹏程跳槽到一家生产AR眼镜的公司。 当时,该公司正在开发一种产品,可以将语音转换为文本并将其连接到眼镜上,让听障人士“看到”并理解他人在说什么。
(照片:Unsplash。
之所以会出现这样的产品,是因为有听力障碍的人在戴上助听器后无法立即理解别人在说什么。
唐轩解释道:“首先,他们要学会声音的含义,也就是要区分不同的声音,比如哪些声音是拍手声,哪些声音是说话声。 然后,他们必须学会说话,也就是要弄清楚句子的意思。 ”
离职后,李鹏程意识到现有的技术无法有效帮助他,他需要学会自己说话——这也是绝大多数听障人士的终极梦想。
在失聪20多年后,李鹏程终于用自己的积蓄安装了人工耳蜗。 在一家照顾听障人士的组织中做志愿者时,他挣钱支付自己的语言学习课程费用。
对于不同类型的听障人士来说,学习倾听和学习说话的难度是不同的。 轻度听力障碍可以听到大多数声音,并且相对容易学习中度听力障碍者可以听到一些声音;严重的听力障碍意味着你什么都听不到,所以学习起来比较困难。
(图片:《寂静的雪》。
2024年植入人工耳蜗后,李鹏程能听到声音。
不过,唐轩说:“在黑客马拉松上和大家交流时,语音转文字技术可以帮助他理解每个人在说什么,但不是全部。 当多人说话,或者说话快速且带有口音时,过渡将不准确。 ”
唐璇,2024年出生,北京科技大学机械工程专业研究生,她报名参加了黑客马拉松比赛,她和老朋友GGC一起,GGC毕业于理论物理专业,从事金融量化研究。
当他们被李鹏程的需求所吸引时,武汉大学物理专业的Chotine和与她一起报名参加比赛的朋友也产生了兴趣。
Chortine 受到人工智能普及的启发,希望利用技术改变生活,并“想成为其中的一部分”。
他们俩和他们的合作伙伴都觉得,李鹏程的需求“是一个非常适用的场景,只要把这个技术做出来,就能帮助到很多人。
根据第二次全国残疾人抽样调查数据显示,我国听力障碍者人数约为2780万人。
目前,国产人工耳蜗的价格在20万元左右,语言学习课程和第一门课程至少要花费10万元,学习时间需要4年,接下来是一个漫长的过程。
线下课程的成本非常高,我们希望开发一款使用AI技术来帮助他们纠正声音的产品。 唐轩补充道,“就是先识别他们的声音,然后用AI对他们不清楚或错误的部分给出具体的建议,并指导他们如何修改和改进。 ”
团队就是这样组建的,几位95后将其命名为“Sound Bridge”。 这款产品旨在帮助听障人士学习说话,被称为“Soundbridge AI Language Training”。
在文心模型的帮助下,SoundBridge AI Language Training实现了团队的想法,在将用户的发音与标准发音进行对比后,可以以文本的形式对正确发音给出有针对性的指导。
李鹏程的主要工作是担任听障**组织的公益项目专员。 在Chortine眼中,“他就像一个团队的推动者”;唐轩觉得“他很有行动力,敢于走出自己的舒适区,接触更多的人,非常令人钦佩。
虽然不是技术专家,不能正常说话,但李鹏程每次开会都非常活跃,“他能为团队的产品提供用户视角,也能帮助对接听障群体资源,促进**机构的交流合作。
正如唐轩所说:“我现在出来做这件事,和以前在学校和工作上不一样了。 不仅因为做这件事的使命感,更因为我们的团队。 经过这几个月,我可以互相学习很多东西,而且也很强大。 ”
唐轩说的“力量”,是商业伙伴之间相互鼓励的力量,也是电影《流浪地球2》中热爱编程和开发的10后少年张艺墨所感受到的AI和技术的力量。
既然人工智能还比较成熟,如果我把一个人复制到电脑里呢?”
那天,一墨像往常一样在家忙着功课,目光却不自觉地被一旁的妹妹吸引住了。 因为爸爸在外面忙,姐姐想陪爸爸的愿望落空了,显得有些沮丧。
你能跟着电影中的“数字女孩”,“复制”一个“数字爸爸”,让它和你的妹妹聊天吗?老张回到家后,听到了一墨的想法。
(图:《流浪地球2》)
在技术层面上,阻力不是特别大。 老张当即决定和儿子一起开发这个名为“AI数字生活”的项目。
Yimo之前没有太多的项目经验,但是在AI的支持下,有很多事情我们俩都不懂,基于AI的知识可以快速解决问题。 “老张说。
Yimo和AI的命运比大多数孩子来得更早。
当他上三年级时,他的父母给他报了一个兴趣班,学习如何制作机器人。 后来,当学习内容开始涉及编程时,他的母亲为他报了一个C++编程班作为辅助。 后来,在学校和广州越秀区少年宫老师的指导下,他专注于学习C++算法编程,直到现在。
本来,老张和妻子只是抱着培养孩子兴趣的想法,但萧一墨却爱上了编程。 当老张回头关注儿子在这方面的学习时,他看到小一墨的算法问题超出了他作为产品的能力范围。
那时候应该是五年级了,我发现他的能力超出了我的预期,这才发现这家伙太厉害了!”
现在回想起来,老张依然惊叹:“我只是花时间和精力陪他看他的C++算法问题,在项目上和他多交流。 ”
也是从那个时候开始,一墨开始利用AI技术尝试做一些开发,老张也加入了学习AI技术的行列。 每当一墨遇到自己和父亲难以解决的问题时,他都会“问AI,问问文心一言”。
在询问的过程中,一墨发现这些前沿技术可以随时随叫随到,而且答案是即时的,帮助用户提高效率。
而且,他们也有一定的独立思考能力,“也会给我们的生活带来一些改变,比如有时候和它聊天,也许能改变你的心情”。
在那之后,日子就像插上了科技的翅膀,飞得又快又高。 Illumination对表达的渴望也是如此。
以前他是一个性格内向,不怎么爱说话的孩子,但和父亲一起成长后,他们之间的共同话题越来越多,从科幻小说**、科技资讯,到IT创新、技术突破等等,用老张的话来说,“亲子关系变得很好了”。
但最好的关系不是翡翠完美无瑕,而更像是琥珀,一些意想不到的“小插曲”,只会给它增添色彩。
就像一墨和老张搭档的旅程一样,时而讨论,时而纠缠,时而争吵,但因为“都是对的人,不对的人”,不但不会激起冲突,反而会在更好地了解对方的同时,成为更好的自己。
他有他的知识和理解力,很多时候我都被他说服了。 ”
老张笑着说:“因为我总是用一些大的理由来逼他,他可能会逼我自己复盘思考,难道我真的会武断吗,其实还是有一些新的可能性。 就在那时,我选择退后一步,试一试。 ”
在AI数字生活发展过程中,一墨和张老一如既往,一个负责技术开发,一个负责产品设计。
此时的Yimo刚刚进入初中一年级,周一到周五都住在学校,周末回家还要完成作业和网课,所以这两天只能抽出4-6个小时进行发展。
在文心一言的帮助下,父子俩对AI数字生活进行了“思想训练”,创造了一个可以参与互动、拥有独立思考的“新生活”。
目前,AI数字生命不仅可以代替不在家陪伴孩子的父母,也可以以保留图像和声音的形式延续逝者的“生命”,还可以生成数字生命形式的家谱作为家族传承。
此外,某些职业的人也可以生成自己的人工智能数字生活,例如律师、教师、顾问,甚至医生。 这样,即使您无法亲临现场或现场,您仍然可以利用您的知识、技能和想法来帮助他人。
为了学习AI技术,开发项目,Yimo几乎把所有的业余时间和精力都花在了身上。然而,他从不把这种努力看作是一种“牺牲”,因为人工智能和开发是他的兴趣和乐趣,“所以他不会因为累而不快乐。
对于儿子对这方面的兴趣,老张的态度是宽容和支持的,尤其是老张,他思考得很超前:“我们对他未来的可能性有更多的期待,我们不担心他走单栈桥。 ”
老张觉得,他和一墨都非常擅长基于AI和IT技术解决各行各业的问题,虽然在开发过程中会遇到困难,但一直以来都充满激情、默契、高效。
如此之多,以至于让我觉得“除了原子弹,我们可以制造任何东西,因为人工智能现在真的很方便。 “老张自豪地说。
如今,Soundbridge 团队 Yimo 和 Lao Zhang 共享的技术,即改变和爱的力量,已经将成千上万像他们一样的开发者聚集在一起。
例如,襄阳段95后一线员工李桑玉利用桨叶成功完成了列车号识别系统的全流程开发,大大提高了车间运营的审核效率,每年为襄阳车段节省了数十万元的成本。
还有大学生高洪志,曾带领团队用划桨搭建沙漠植树机器人,现在已经投入实验,具备了在沙漠中植树的能力,为沙漠管理提供了新的可能性。
以及谢菲尔德大学博士生彭旭潭,利用PaddlePaddle的AI技术开发了一本“汉语-少数民族语言”词典,可以在汉语和少数民族语言之间进行翻译。
还有更多像他们这样的开发人员正在使用尖端技术来改变世界。 他们是如此不同:他们有着不同的背景、兴趣和爱好,他们开发的产品和技术被应用在不同的领域,造福了不同的人群,给他们的生活带来了不同的变化。 他们都是一样的:他们都拥有创造、改变和爱的力量,他们都在桨平台上成长和成就,他们被世界看到。 更何况,今天,他们都齐聚中国最早关注深度学习开发者的大会——2023 W**e Summit + Deep Learning Developer Conference 2023,再次相互激励,赋予彼此用科技创造美好生活的力量。 明天,这群实力派开发者将回归他们的生活和事业。 但权力的余波不会消散,追逐梦想的脚步也不会停止。 未来,越来越多的人会像他们一样拥抱人工智能、拥抱科技,拥抱更新更美好的生活。