

Google 推出 Gemini 3.1 Flash TTS 文本转语音模型 支持近 70 种语言
Google 宣布在其 Gemini 3.1 系列中推出一款全新的文字转语音模型 Gemini‑TTS,被官方描述为「至今最富表现力的文本转语音解决方案」。新模型能够生成听感自然、高保真的语音,同时允许开发者通过提示词(prompt)控制语音的情感、节奏和风格,例如在旁白或对话中精确调节语气、停顿与情绪变化。
在多语言支持方面,Gemini‑TTS 覆盖约 70 种语言,包括中文(普通话)、英语、西班牙语、德语、日语等主流语言,模型可自动检测输入文本的语种,无须手动标注语言类型即可生成对应语音。这一能力使得开发者和企业可以在有声读物、播客、语音助手、客服机器人、教育应用等场景中,用一套统一的 API 为全球用户提供多语种语音内容。
Google 还强调,Gemini‑TTS 与 Gemini 3.1 系列的其他音频模型(如 Gemini 3.1 Flash Live)协同,进一步强化了「实时语音体验」的能力。在实时对话、语音翻译及多模态交互中,系统可以在保持低延迟的同时,通过文本提示和音频标记精细控制语音输出,让 AI 代理在电话、会议、导航等场景下更接近自然的人类语音交互。(消息来源:cnBeta)

c 开启身份证件审核
4 月 15 日消息,Anthropic 于当地时间 4 月 14 日发布公告,称正在为 Claude 的一些用例推出身份验证。
Claude 是由 Anthropic 构建的大型语言模型,官方表示,当用户访问某些功能时,可能会看到验证提示,这是其例行平台完整性检查或其他安全和合规措施的一部分。仅使用用户的验证数据来确认身份,不用于任何其他目的。
官网提示的要求如下:
您需要准备什么:
有效的政府颁发的带照片的身份证件:实体文件,在手边
带摄像头的手机或电脑:您可能需要用手机拍摄实时自拍照,或使用网络摄像头
几分钟时间:验证通常需要不到五分钟
接受的身份证件类型:
接受来自大多数国家的原始、实体政府颁发的带照片的身份证件。常见例子包括:
护照
驾驶执照或州 / 省身份证
国家身份证
您的身份证件必须由政府颁发、清晰易读、完好无损,并包含您的照片。
为什么我的账户在验证后被禁用了?
作为我们安全流程的一部分,我们可能因多种原因禁用账户:
重复违反我们的使用政策
从不支持的位置创建账户
违反服务条款
18 岁以下使用(消息来源:IT之家)
Uber 战略转型 豪掷百亿采购无人车入股供应商
4 月 15 日,据《金融时报》报道,美国网约车巨头 Uber 承诺投入超过 100 亿美元,用于购买数千辆自动驾驶汽车并入股其开发商,背离其轻资产的「零工经济」商业模式,以避免遭受自动驾驶出租车浪潮的冲击。
过去一年,Uber 大幅加快了交易布局,宣布与包括中国百度、美国 Rivian 在内的十多家供应商建立合作伙伴关系,并计划于 2026 年在至少 15 个城市推出自动驾驶出租车服务。
根据英国《金融时报》基于分析师预估及知情人士透露信息所做的计算,这些交易将使得 Uber 在未来几年投入超过 25 亿美元用于股权投资,并花费逾 75 亿美元建设自动驾驶出租车车队。这些协议的前提是合作伙伴达到特定的自动驾驶汽车部署节点。
对于 Uber 这家从硅谷崛起,长期被视为「零工经济」代表的企业而言,这些投资是一次显著的战略转向。该公司开创了一种依赖司机使用自有车辆载客的轻资产模式,从而颠覆了出租车行业。
周二,电动汽车制造商 Lucid 表示,Uber 已扩大了双方此前达成的一项协议,将向该公司总计投资 5 亿美元,并购买至少 3.5 万辆 Lucid 汽车,这可能将花费 Uber 至少 20 亿美元。(消息来源:网科技)

字节跳动新一轮期权回购价格再创新高
4 月 15 日消息,据大厂青年公众号消息,字节跳动今日发布内部邮件,启动新一轮期权回购。
据了解,本轮回购方案中,在职员工每股回购价为 229.5 美元(约合 1567 元人民币);离职员工每股回购价为 201.96 美元(现汇率约合 1379 元人民币)。
字节跳动上一轮回购期权是在 2025 年 10 月,当时回购价格为在职员工每股 200.41 美元(现汇率约合 1369 元人民币),离职员工每股 180.37 美元(现汇率约合 1232 元人民币)。(消息来源:IT 之家)
OpenAI 计划为 ChatGPT 广告推出新定价模式 并探索其他升级功能
4 月 15 日消息,一位与 OpenAI 员工有过交流、同时服务 ChatGPT 广告主的代理商高管透露,OpenAI 计划对部分 ChatGPT 广告采用按点击量计费的模式,而非仅按曝光量计费。
该高管表示,与此同时,OpenAI 还计划推出旨在引导用户完成特定操作的广告,例如促成购买或下载应用,但目前尚未确定具体落地时间。这些举措体现出 OpenAI 为实现宏大增长目标、挑战 Meta 与谷歌,正努力让 ChatGPT 对营销人员更具吸引力。
OpenAI 于 2 月初在 ChatGPT 中正式上线广告,截至目前,仅向早期广告主提供曝光量、点击量、投放花费等汇总数据。与之形成对比的是,数字广告巨头 Meta 与谷歌会提供更详尽的信息,包括广告受众特征以及广告是否促成转化购买。(消息来源:环球市场播报)

宇树:受时间精力限制 仅 H1 一款机型参赛机器人半马
4 月 15 日,宇树科技官方确认,将参加 4 月 19 日在北京举行的人形机器人半程马拉松。受时间与精力所限,宇树官方仅派出 2023 年款 H1(微调版)一款机型参赛。此外,还有众多独立团队基于宇树产品进行自行开发后参赛。
宇树科技公布的内部测试数据显示,H1 在训练中已取得半马 50 多分钟的最好成绩。该机型为 2023 年款 H1 的微调版本,旨在挑战经典型号自身的性能极限。
根据官方披露的训练时间线,H1 的速度提升极为迅猛:2 月底达到 5 米/秒以上,3 月提升至 8 米/秒以上,4 月进一步飙升至 10 米/秒。这一训练成绩的跃升,充分展现了宇树科技在人形机器人运动能力上的快速迭代能力。
据悉,本次赛事将于 4 月 19 日在北京经济技术开发区鸣枪开跑。赛道全长 21.0975 公里,首次引入南海子公园生态路段,融合平地、坡道、弯道、狭窄路段等 10 余种地形,包含接近 90 度的急弯。
赛事规则明确:自主导航赛队的成绩按实际计时记录,遥控赛队的成绩需乘以 1.2 的加权系数,以引导技术向自主化方向发展。(消息来源:快科技)

我国网民平均每人每天刷视频超 200 分钟,微短剧人均单日观看时长超长视频
4 月 15 日第十三届中国网络视听大会在四川成都开幕,《中国网络视听发展研究报告(2026)》发布。
报告显示,截至 2025 年 12 月,我国网络视听用户规模达 10.99 亿人,同比净增 776 万人。
网络视听人均单日使用时长超 200 分钟,微短剧人均单日使用时长为 129 分钟,已超长视频。
此外,短视频应用实现使用率和用户规模持续双增长,44.6% 的新入网网民第一次上网使用的是短视频应用。
2025 年,AI 生成 20 亿 + 条视音频,较 2024 年增长了 14 倍以上。过半数用户接触过 AI 生成的视音频内容,其中四成以上认为 AI 生成的内容新奇有趣、更感兴趣。(消息来源:IT 之家)
前 Neuralink 联创 Max Hodak 加速推进「生物混合型」脑机接口
4 月 15 日消息,由 Max Hodak(Neuralink 前总裁兼联合创始人)创立的脑机接口公司 Science Corporation,宣布正在加速推进「生物混合型」脑机接口产品神经外科权威 Murat Günel 加入,主导其在美国的首次人体临床试验准备工作。
与传统脑机接口依赖金属电极直接刺激或读取脑信号不同,Science 的方案尝试将「生物」与「电子」结合,也就是在硬件中嵌入实验室培养的神经元,通过光刺激与电信号交互,让这些神经元与人脑自然融合,从而构建「生物混合型」脑机接口产品。公司认为,这种方式有望避免金属电极长期植入带来的脑组织损伤问题。
从行业现状来看,包括 Neuralink 在内的多家机构已经能够通过电子传感器读取脑信号,让 ALS(肌萎缩侧索硬化症)或脊髓损伤患者用「意念」控制电脑或输出文字。但这类技术仍面临监管复杂、适用人群有限等问题,商业化路径尚不明朗。
而 Science 的路径则更偏「温和」:其首批人体试验不会直接植入含神经元的完整设备,而是先测试一款高密度传感器(约 520 个电极,尺寸接近豌豆),并将其放置在大脑表面(而非深入脑组织),这种设计也让公司认为风险较低,甚至计划不走 FDA 审批路径。不过相应产品从实验室走向临床仍需时间。Günel 表示,即便一切顺利,人体试验在 2027 年启动都已经算是「相对乐观」的时间表。(消息来源:IT 之家)

小鹏旗舰 SUV GX 预售:旗舰版 39.98 万
4 月 15 日,小鹏旗舰全尺寸 SUV 车型 GX 正式开启预售,旗舰版增程与纯电车型同价,均为 39.98 万元。
该车长宽高分别为 5265/1999/1800mm,轴距达 3115mm。外观采用分体式车灯并搭载 AI 数字投影大灯;内饰配备 17.3 英寸 3K 中控屏、33 枚 AI 音响及 0.16 秒变色的 AI 调光隐私玻璃。
空间上,GX 采用 2+2+2 六座布局,配备零重力座椅及同级唯一的三排电动三折叠座椅,后备箱拓展容积可达 1748L。作为前装量产 Robotaxi 原型车,该车搭载 3000TOPS 算力及无激光雷达方案,支持 L4 级自动驾驶标准。硬件上采用 16000t 前后一体大压铸,标配双腔空悬与后轮主动转向。
动力提供双版本:增程版综合续航超 1585km;纯电版基于 800V 平台并支持 5C 超充,CLTC 续航最高 750km。(消息来源:快科技)

阿里ATH发布AI开发工具Meoo,可一键开发一键部署
4月15日,阿里ATH事业群发布旗下首款AI开发工具Meoo(秒悟),该工具集成了千问、Kimi、GLM、MiniMax四大顶尖模型,并内置阿里云数据库、存储等核心产品服务。
用户无需任何编程基础,只需用自然语言描述想法,Meoo最快1分钟就能自动生成前端后端完整的网站、H5页面,并在阿里云上一键部署上线。即日起,所有用户可直接访问官网体验。
例如,销售人员准备在节假日做促销活动,只需在Meoo上输入活动规则,几分钟就能生成一个精美的H5活动页,并能展示转化数据。对于创作者来说,可以将个人作品集或一段文字描述发送给Meoo,AI能快速生成一个可交互、像素级还原的个人作品集网站 。(消息来源:极客公园)

卖鞋不如卖算力!Allbirds 一夜「变 AI」,股价一度暴涨超 800%
4 月 15 日,曾经红极一时的「硅谷神鞋」Allbirds 正式宣布了其商业史上最魔幻的一次转身,卖掉赖以生存的鞋履业务,拿着剩下的「壳」和新融到的 5000 万美元,杀入 GPU 算力租赁赛道。
Allbirds 这家曾以环保理念和「科技感舒适鞋」走红的品牌,如今选择彻底告别主业,转身投入人工智能浪潮。
该公司宣布完成一项规模 5000 万美元的可转债融资,用于转型 AI 算力基础设施,并计划更名为「NewBird AI」。消息公布后,股价单日暴涨超过 800%。而就在不久前,这家公司还在出售其鞋类业务,整体估值仅约 3900 万美元配资资深股票配资门户,甚至一度接近停止运营边缘。(消息来源:智通财经)
广盛网配资提示:文章来自网络,不代表本站观点。