汇聚了10名顶尖人才、成立仅两月的Cognition公司,推出了其首款「AI工程师」——Devin,该工程师具备独立作业和编写程序的高超能力。
全球首位虚拟AI工程师Devin诞生!此次诞生的Devin并非由微软、OpenAI、Google等科技巨头打造,而是由崭露头角的新创公司「Cognition」所精心培育。Devin不仅懂得编写软件、搭建网站,还能熟练运用各类工程工具,其程序能力远超其他AI模型。
Cognition在官网上自豪地宣称:「来认识Devin,这是世界上第一个完全自主的AI软件工程师。」Devin是一位不知疲倦、技术娴熟的合作伙伴,随时准备与你并肩作战,或者独立完成任务供你检验。
Devin的强大之处在于,它能够自主搭建网站、编写程序。据《彭博社》报道,Devin AI与微软推出的AI助手Copilot类似,但能力更上一层楼。它可以独立承担整个软件或网站开发项目,例如,若要它「建立一个搜集悉尼所有意大利餐厅的网站」,Devin会自动搜集餐厅电话、地址等资讯,并建立罗列这些资讯的网站。
根据Cognition官网,Devin甚至拥有「成长」的能力,它可以阅读文章,学习原本不懂的技术,还会自主寻找程序代码中的错误并进行修正。此外,Devin还能够训练和微调自己的AI模型,只需提供GitHub上的代码仓库链接即可。
Cognition表示,他们利用SWE-bench测试Devin解决程序问题的能力,并成功解决13.86%的问题,远远超过由Claude 2创造的1.96%技术。即使有人协助,过去AI模型最多也只解决4.8%的问题。
SWE-bench是测试系统自动化解决现实问题能力的数据库,从12个领域收集了多达2,294个问题。
Devin自主解决问题的能力远超当前其他模型。目前,Devin尚未完全对外开放使用,想要抢先体验的用户需要在官网上提交申请,加入等待名单。不过,根据外界实际测试的反馈,Devin可以在5到10分钟内从零到有建立一个网站,并且可以在同样的时间里创建网页版的《乓》——史上第一款电子游戏,尽管仍需多次输入提示进行优化,但成果已令人满意。
电脑科学家阿尔伯蒂(Silas Alberti)表示,Devin给人感觉不像只是一个能编写程序的AI助手,更像是一个可以独立工作的真正员工,「这感觉非常不同,因为它是一个真正可以帮你做事的自主系统。」
Cognition表示,有了Devin,工程师可以专注于更有趣的难题,团队可以追求更具雄心的目标——某种程度上,这是在委婉地表示Devin并不是为了取代工程师,而是为了协助工程师而生的AI助手。
短短时间内打造出Devin的Cognition究竟有何神秘之处?许多人可能都没听说过这家公司,因为它仅成立短短2个月,直到发布Devin之前都保持低调。不过,Cognition目前已获得知名投资人彼得.提尔(Peter Thiel)旗下Founder Fund领投的2,100万美元,其他投资者还包括前推特高管艾拉德.吉尔(Elad Gil)。
Cognition由27岁的执行长史考特.吴(Scott Wu)、技术长史蒂芬.郝(Steven Hao)及产品长瓦尔登.严(Walden Yan)三人共同创立,目前团队仅有10人——然而,他们个个都是人才,声称曾获得国际奥林匹亚资讯竞赛多达10面金牌,并在DeepMind、Scale AI、Waymo等众多企业从事AI相关工作。
彼得.提尔领投了Cognition的2,100万美元融资,认为他们有着与OpenAI、DeepMind、Scale AI等当红AI公司比肩的实力。图/Gage Skidmore from Flickr
技术长史蒂芬.郝曾担任AI标注公司Scale AI的顶尖工程师,而技术长瓦尔登.严则曾是哈佛学生——直到最近才透露自己辍学的事实。史考特.吴和同在公司的兄弟尼尔.吴(Neal Wu)从青少年时期就是国际程序比赛的常胜军,还是国家队选手。
「我在9岁时开始学习编程,那时我就爱上了编程。」史考特.吴在采访中提到。
值得一提的是,Cognition亮相后,网络上也疯传一部称是2010年史考特.吴参加Raytheon Mathcounts数学比赛的影片,他以极快的速度解出考题,甚至出题者还未念完整道题目,他就已经在心中计算出正确答案。
史考特.吴指出,教导AI成为工程师很像他们过去参加比赛一直在做的事,不过现在有机会在AI系统中编写程序。对于他们如何打造出Devin,他仅声称团队找到了将大型语言模型与强化学习(Reinforcement learning)结合的独到方法,并未透露技术细节。
彼得.提尔在声明中表示,他的创投并不常投资AI公司,但他认为Cognition有着足以与DeepMind、OpenAI、Scale AI等当红AI公司比肩的实力。
标签: 比特币挖矿