开场0:00
本次节目我们和老朋友 Shihang 一起聊聊今年的 WWDC, 从 macOS 到 Siri、AI、Safari, 苹果这次的更新看起来都不算陌生 。 当苹果再次强调 AI 要成为它生态的一部分 , 它是在继续补课 , 还是终于找到了一条自己的路 ?
这里是 《 牛油果烤面包 》。
嘿 , 大家好 , 欢迎来到新一期的 《 牛油果烤面包 》, 我是 Sean。
我是 Cat。
我是 Vindy。
嗯 , 大家猜猜看我们今天又到了什么喜闻乐见的环节 。 我们 《 牛油果烤面包 》 有个传统 , 就是每一届 WWDC 我们都不会错过 。
同时大家可能细心的观听众可以发觉 , 每一届 WWDC 我们都会有一个固定的嘉宾 , 就是 Shihang。
你好 , 我是 Shihang。
所以可以跟大家介绍一下你跟 Apple 的渊源吗 ? 为什么每次 WWDC 都有你 ?
哦 ,因为我也是一个非常老的 iOS 的 engineer, 所以已经很久没有 iOS 了 。 但是我一直到至今还是苹果的死忠粉 。
啊 , 非常死忠的果粉 。 那我们今天就聊一聊这一次 2026 年的 WWDC, 同时也是 Tim Cook 最后一届的 WWDC 吧 ?
就是他主持的最后一届 ,是不是 ?
可能是的 。
他退休了还会主持吗 ?
好像说去 —— 不对 ,sorry, 明年就是换下一个新任的 CEO 了 。 这是他的最后一次主持 WWDC。 但我还蛮吃惊的 , 就是好像没有什么那种说告别啊那种环节 。
就感觉这是个蛮正常的 WWDC。
对 , 可能因为他将来还可以以吉祥物的形式出现 。
哈哈哈 。 我就感觉就是这么多年,Tim Cook 主掌那个 WWDC 这么多年, 我觉得现在我提到 WWDC, 第一反应就是以前微博有个账号叫 " 天才小熊猫 ", 然后每次都会 WWDC 弄完之后会出一个那个连环的照片系列 , 就是 amazing、amazing, 观众们老爷们我们又想死你了 。
我不知道大家有没有看到过那样的梗图 。
哇 ,他现在还出吗 ? 我感觉他是不是年更啊 , 还是两三年才一更啊 ? 我都快忘了有他的存在了 。
对 , 好像已经是一个比较有年代感的一个事情了 。 那这次 WWDC 借出了哪些东西呢 ? 我觉得我们可以慢慢来看 。
macOS新设计2:36
首先他先介绍了一下 macOS, 然后新版的 macOS 叫 Golden Gate。 我们其实都住在湾区 ,Golden Gate 这个名字对我们来说肯定不陌生的 。
就是金门大桥 。 但我还是还蛮吃惊 ,因为之前好像每次那个系统的那个名字都是那种加州自然风光的名字 。
这次是第一次是人工景点了 。
好像还真的是呢 。
对 ,以前很多都是国家公园的名字 , 什么 Catalina 呀 , 就是整个加州的国家公园都被它用光了 。
对 ,Bixter。 我记得很早以前 macOS 它是以那个猫科动物为命名 , 后来说猫科动物 , 哎 , 我们快用完了 , 然后就换成那种景点景点的 。
现在又变成人工景点也可以 。 那我觉得它可以随便起了 ,但是可能没有人在意这个事情 。
嗯 ,但还是跟加州有点关系的样子现在 。
那非常欢迎听众朋友们如果有空的话 , 可以来经过一下著名的金门大桥 。 哎 , 那这次 macOS Golden Gate 里面有特别介绍了一些什么样的新的功能和改动呢 ?
Redesign 吧 , 最大的功能就是 , 或者说是每年一次的 Redesign。 这一次就变成了又换了新的 。 然后我看到网上很多人吐槽 , 就说这个又把这个审美好像变 low 了 。
变 low 了 ?
把 Liquid Glass 改回去是不是 ?
没错 , 它变成了 Liquid Glass, 变成了很多层的毛玻璃叠加 。 它是这么一个解释的方法 。 所以呢 , 它就是在彩色模式下呢 , 就像有点 , 它就像很多个盘子 , 玻璃盘子叠在一起 , 然后放在一起 , 然后从上面看的感觉 。
然后它也有另外一个模式 , 就是把所有的颜色都去掉 , 然后就变成纯的只有毛玻璃 , 那你就只能看见它的高度落差 。
好像是说这一次在新的这种设计的改版里面 , 可以让用户可以自己去调节自己想要多少那个 Liquid Glass 的效果是吗 ?
是的 。 我都没有调了 。 我装完 beta 版之后, 直接就让它这个设置留在中间 , 随便你觉得什么样是推荐配置就什么吧 。
所以 Cat 已经装了预览版了 ?
对的 。
所以就用预览版来说 , 你感觉上有什么视觉上的区别吗 ?
我觉得还是 , 看起来相对顺眼的 。 我没有觉得难看 。
能不能用一点更精确的词汇来描述这个东西 ?
Pleasant。
嗯 , 那还挺好的 。
对 ,而且也没有特别的卡顿啊什么的 。 中文输入法有时候会卡一下 。
因为我记得好像是之前 , 去年的时候 Liquid Glass 刚刚推出的时候 , 它的预览版做的那种反光效果做得特别 fancy,但导致好像电池和性能就一塌糊涂 。
改了好几版 , 最后改成了一个阉割得非常厉害的版本 。
我的主打的 Mac 还没有升级到 macOS Tahoe, 就是这个原因 。 就是因为我不想要把我的主打的 Mac 升级到用 Liquid Glass,有可能就跳过 Tahoe, 直接升级到 Golden Gate 了 。
嗯哼哼 。 那这次 Golden Gate 那个还是叫 Liquid Glass 是吧 ?
对对 , 它优化了一下, 可能没那么难看 。 性能也感觉好很多 。
因为我记得就是去年的时候 , 它那个 Liquid Glass 刚推出在预览版的时候 , 很惊艳的点是在那种一把那个边缘 , 哪个东西在那边拖来拖去 , 你可以看到它那个 Liquid Glass 的它那个边缘那个反光光的效果特别华丽 。
但是后来这预览版好像把这个功能大幅地削弱 , 可能就是因为太吃性能 。 我不知道现在新的版本是怎么样了呢 ?
这个我也没有看细节 ,不知道呢 。
可能没有注意到是吧 。
对 , 可能这个细节已经不重要了 。 其实有点像这些 3A 大作 , 疯狂地去卷这种水面的 3D 效果 ,其实你真的玩起来 , 用起来你也不会注意得到 。
但是就作为一个噱头就很好 。
对 ,而且我觉得这种东西 , 我就感觉让我想起来以前我找了个 Airbnb, 然后在那个旧金山 Twin Peaks, 一个风景很好的地方租了一个 Airbnb, 然后它就是打开窗 , 就是前面就是那种山的前面的坡的景色 , 哇 , 特别华丽 。
然后我第一天就是哇好棒啊 , 第二天嗯还不错 , 到了第四天的时候已经感觉不到这个东西了 。 感觉可能 OS 这方面这种华丽的效果也是这样 , 就是可能用久了之后就完全不会注意到这些东西 。
我玩那些高端的 3D 游戏也是这样 。 我只有在进游戏的前 10 分钟 , 我是打开画质最高 Ultra, 然后看一下, 哦看完了 , 好 , 调回最低画质的速度 。
我觉得一点非常非常实用的打游戏的小技巧 。 然后我还看他说是把整个的图标也重新设计了是吧 ?
一些第一方的图标 。
对的 。
所以他那句话看起来很愉悦 。 好 , 那我觉得作为一个播客节目 , 我可能也很难跟听众朋友自己描述这个愉悦到底是为什么 。
然后我 。
就是因为好看吗 ? 我其实有点好奇 Cat 的评价 ,因为我还没敢去下载新的 。
我觉得就是看起来比较美观 , 你不觉得它在抢你的注意力 ,但是你肯定要找的时候它又很 , 还是很容易识别出来那个 。
就它没有偏离它原来的设计很远很远 , 又不至于堆叠太多的什么三维的效果让你觉得它在那里抢你的注意力 。
我看到朋友圈有个朋友还蛮好玩 ,他说就是在这样一个大家都在跟 AI 聊天的设计大颠覆的时代 ,Apple 还花这么多的时间说看我们的图标变了 , 改了一下设计 。
对 ,是很搞笑 。
甚至极端点的说法就是以后可能那个 App 的图标你在整个使用系统的过程中都没看到过 , 这也是有可能的 。
那除了刚才说的就是令人愉悦的新的 Liquid Glass, 那还有什么一些 OS 上面的改进呢 ?
他们有一个说法是说现在的搜索的索引增快了 。 就是以前大家都很抱怨一个问题是 , 我有一些新的照片刚刚拍的 , 然后搜的时候搜不出来 。
然后据说现在已经改进了 , 就是说你新添加的内容很快就能够被索引起来 , 就是你搜索能搜索到 。
但因为我最近也没有搞这样的操作 , 所以我也不知道这个是不是真的就那么快了 。
这个搜索就是 Spotlight。
对 。
好像我看那个 。
搜图片手机上的 ,不知道算是算不算 Spotlight 一部分 , 可能也算 。
好像我看他也专门提到了说是花了一定的精力在于整个 App 的加载速度啊 , 各种各方面的性能优化什么之类 。
对 , 所以现在就很多人就说苹果每一次升级都要把老的手机型号搞慢 , 这样才能够卖出新的手机 , 对吧 ?
然后为什么这次 Tim Cook 这么有胆量地说我就把我的 OS 做得比以前要快了 , 这不想卖手机了吗 ?
我个人的观点是 , 对于 Tim Cook 这个人来说 ,他确实不需要想要卖手机了 ,因为他可以承认了 。
就是这样 。
我走后管他洪水滔天 。
对 , 我留下好名声 , 好的名声就可以了 。 那听上去都是一些非常怎么说呢 , 扎实的一些改动啊 , 就是图片变好看了 , 同时性能变好 。
那你除此之外有没有什么功能性一点的 , 新的功能的方面的更新呢 ?
儿童账号9:59
有啊 ,他们说完这些就是系统级别的改变之后 ,他们也花了不少时间在讲就是 Trust and Safety, 就是用户安全这方面的 。
尤其是说了很多关于小孩子账号的这样的功能 。 但我觉得我们这里有资格讨论小孩子账号的就只有 Shihang 一个人了 。
并不是吧 , 我觉得 Cat 你也很快会用到的 , 你也会变成深度用户 。
对 , 现在还不开放给小孩用 。 现在对小孩的控制就是你完全不能用手机 。 那我就是有一个 7 岁的娃喽 , 现在娃就 。
用手机这个事情确实是很多家长都特别关心 , 特别 concern 的 。 那他现在这个新的改变就是 ,他把一些很原来很多各种零碎的功能 , 把它整合到了一个很方便的 flow 的一个工作流程里面去 。
就是比如说以前你要去允许限制孩子上什么网站 , 那你要手动地在那个苹果设备上面去手动地允许或者禁止 。
然后还有跟谁联系 , 跟哪一些人联系也是要手动允许禁止的 。 现在呢 , 就可以很方便地他在手机上面去发一个请求 , 然后我就可以在我自己的手机上面收到一个短信 , 然后我就可以去允许或者拒绝了 。
那这对于家长来说是方便很多 。
对 ,以前的时候就是你孩子可能说可能要跑到你房间把你门敲开来 , 说爸爸你帮我允许一下这个东西 , 然后把手机给你 , 你把它点完之后就还给他 。
现在就是他就可以自己拿着手机给你发个短信 , 你就 OK 了 。
没错 , 你可以想象一下, 当你在厕所的时候 , 然后孩子抱着一个 iPad 要求你去给他解锁 。
你不就是为了解决这个问题 。 我可以想象就是比如说小孩 , 小孩在什么哪里去玩的时候 , 突然见到个新的朋友要加一下 ,但是你不在身边 ,他可能要等到今天晚上回家了之后再找到你 , 再把这个人加上, 再可以跟他联系 。
没错没错 , 这就取得一个平衡 。 不过有时候就想这个 , 我们都活成了自己最讨厌的样子 , 我们都在搞花季护航了 。
年纪大一点的人就期待大列有个什么绿坝 , 然后就是可以健滑啊干嘛的 , 然后封禁一些不想给孩子看的网站 。
那除了这个可以远程地给予这个允许之外, 那还有什么跟小孩相关的功能吗 ?
它还增加了健黄功能 。
什么东西 ? 真的是特别地提到这个东西吗 ?
是这样的 , 就是如果在短信里面如果出现了色情内容 , 那么它就会禁止 , 比如说裸照之类的 , 它就会加一个警告 , 加一个警告 , 然后问你是不是确实要看 。
小孩肯定更开心吧 。
这警告是给你看的 , 还是给你看小孩看的 ?
但是这个东西呢 , 就是两边都能看到的 , 一定是小孩能看到 , 那家长当然也能看到了 。
他刚才是说现在这个账号就有个小孩模式是吧 ? 就是你会 。
你在设置一个设备的时候 , 你可以创建一个家庭 , 然后可以给孩子的这个设备专门创建一个儿童账号 。
它那个中文名也要输你的出生年月 , 这样它是到 13 岁之后它就会自动变成一个成人账号 。 然后小朋友的账号呢 , 那它就是会有这些功能 。
然后你还可以限制屏幕使用时间 。 苹果这一次它就说他们跟美国的儿医协会进行了深度合作 , 做了很多研究 , 然后就给出一些推荐的每天的屏幕时间 , 好像是一个小时还两个小时 。
这么少吗 ?
好啊 , 牺牲了还是就是所有小孩 。
可能是跟年级有关 , 年龄有关系 , 我要看一下 。
那我现在三十几岁 ,他的建议时间是多少 ? 我想给自己设一下 。
你有完全民事行为能力了 , 没有人管得了你 。
你有 screen time 吗 ? 你也有这个功能 。
而你这次小孩的那个是可以由爸爸妈妈来设置的 , 就跟你自己设给自己的 screen time 不一样 。
对 。
对 , 它主要是起到一个 set, 设定这个期望值的作用 , 这样你就不会出现说家长跟小孩每天都要讨价还价 , 到底要玩多久 ,而是就一次说好 , 然后呢 , 就每天就是一个小时两个小时, 这样就不会有这种 back and forth 的问题了 。
这是对于你家长来说是个好事 , 就是到时候小孩你找你的要说哎我要用一下更多的时间的时候 , 你看你看哎美国那个什么专家说了你就只能用两个小时, 你就用两个小时吧 , 就这样 。
对啊 , 就是把这个规则定好了嘛 , 定好了我们就协商一次 , 然后我们这一次就很好几个月都是这么这么过 , 你就不需要每天的拉扯 。
你刚刚你提到说你就是设置好小孩的那个年纪之后, 它会自动去 check 小孩是多少岁嘛 , 那可能会说每一年它就自动地开始加一点点时间 , 加一点点时间 。
我觉得应该是 , 还没有试用 ,但是我如果说试用 , 应该是说如果你选择这个设 , 默认设置的话有可能会就是自动改变 ,但你也可以手动设 , 你可以把它设置成 15 分钟 。
那就是这次介绍的关于小孩控制的主要功能吗 ? 还有什么其他功能吗 ?
对 , 这个小孩设置对家长真的是一大福音 。其实这个也是炒冷饭 , 它是一个 incremental improvement,其实也不算真的不算真的是特别大的新功能 ,但是它就每年都提一下 。
所以这事情上去年前年的 WWDC 都提到这件事情 。
很久很久以前就有了 , 我一直都在用 , 只是今年确实它把它 , 它可能有一个工作组 ,有一个专门一帮人一起去把这个理顺了 , 把这个产品 。
我觉得刚刚提到那个远程控制 , 我觉得听上去还是挺实用的一个事情 。
我刚刚问了一下 AI, 它说是就是这是一个产品的重新设计吧 ,不是算是从零开始打造一个产品 。 就是说以前其实 screen time 你也可以设你家的小孩一天可以用多少个时间 ,但主要这是看父母自己的认知来决定给他多少时间 。
然后现在 time allowance 呢 , 就相当于是跟美国儿医学会合作 , 根据他们做的这个研究来根据年龄提出一个建议的 , 就是说建议多少岁的小孩给他多少时间每天来用屏幕 。
然后呢 ,以前呢 , 你只能用 downtime 来就是直接划开说这个时间你是根本就不能用的 , 除了白名单上的一些应用以外 ,其他所有东西你都不能用 。
然后现在有一个叫做 schedule 的功能 , 你可以规定小孩什么时间段可以用什么样的应用 , 就稍微变得更灵活一点 。
就例如说白天你可以用来做一些跟上学啊课业啊有关的应用 , 然后到晚上几点到几点开始你可以打游戏啊或者跟朋友聊天啊 , 那这个都可以设 。
那有了这些功能之后,Shihang 作为一个家长 , 你觉得还有什么痛点没有被解决 ? 你想要喊话 Apple 下一次给你加一下 ?
这是个好问题 。 我觉得只能喊话就是说就是加强内容的审核吧 , 这种特别是保证 keep 这些大的 platform, 比如说 YouTube 啊或者 Roblox 这些大的 platform keep them into account, 让他们就是加强审核 ,不要让这漏网之鱼跑进来 。
感觉好像刚才提到的那个内容的那些审核 , 比如说黄图的检测什么的 , 应该只是应用到 Apple 自己的地方的软件上面吧 , 比如说 iMessage 之类 ,YouTube 之类的还是靠 YouTube 自己去这么搞 。
没错没错 , 所以我就是说就是这也是还是个漏洞 ,因为小孩还是要看 YouTube, 它只是把 message, 当然 message 这个破坏力是最大的 , 所以确实它把它这个进行监控是有好处的 。
作为那个以前在油管干过的 , 我看油管对于 YouTube 对于这个其实管得还挺严的 , 它有专门的 kids team, 然后但是可能现在小朋友都不太用那个 kids app 了是吧 ?
就是可能都直接在那个 main 上面用大人的 account 去看 。
倒是不会 , 我小孩还是在看 YouTube Kids, 它很多这些 Minecraft、Roblox 的博主也会把视频传到 YouTube Kids 上面 。 然后现在其实也还好 , 然后之前有一段时间吧 , 前几年不知道记不记得 ,有一个很大的事就是 YouTube Kids 有人有一些人就故意传一些很别点 , 对 , 就是那些很恐怖的 , 很抽象的那些 。
童话黑化的那种 。
没错没错 , 还有很多性暗示的东西 , 这就造成了很广泛的影响 。 那现在稍微好一点 ,但是我有时不时还是会看到有一些它的那个预览图非常令人不安 , 然后它内容也比较很不健康 。
所以我一般我是看到了就会直接举报 。
而且我感觉现在有了 AI 生成了之后, 生成这种垃圾还是比以前成本要低很多 。
没错 , 现在就是 AI 导致的就是说你工跟房完全不对称 , 你可以无限生成这些故意生成有害的内容 , 然后你防范就防不胜防了 。
所以就是小孩能接触到的所有内容平台都是希望他们能够增加一下自己的防护力吧 ,在这样一个内容泛滥的时代 。
那好 , 差不多其他的 macOS 的主要更新就是这些了 。 我们回顾一下就是 Liquid Glass 变得更好了 , 然后性能变得更好了 , 然后还有就是特别的小孩的防控那边做了更多更好的整合 , 加一些实用的功能 , 差不多这些 。
那我们准备好进入到大头了吗 ? 这次 macOS 的大头显然就是 Apple Intelligence 了 。其实我觉得 Apple Intelligence 之前他们在 WWDC 就已经吹了半天了 , 包括我记得 iPhone 17 还是怎么样 , 反正它那个时候重点宣传就是 say hello to Apple Intelligence,但是整整一年我感觉好像都没有什么火花 。
AI架构20:06
这次感觉像有点像是那种再进攻的感觉 。
两年了吧 , 如果没记错的话 。
甚至我好像看到有些分析是说今天这次的 Apple Intelligence 还特地地提到了它在这两年的设备上面会有一些特殊的功能 , 就是相当于是其实 Apple 在硬件方面为这件事情已经准备好了 。
确实当年当时发布的那个设备是 say hello to Apple Intelligence,但是 Apple Intelligence 本身它迟了这么多时间再来 。 那这次的 Apple Intelligence 它主要的更新是什么呢 ?
我觉得首先第一个吧 , 就是它更新了它的模型 , 说它现在的 foundation model 就是基础模型是基于 Google 的 Gemini 的基础模型上面做出来的 Apple 的模型 。
实际效果怎么样大家不知道 ,但至少它说他们更新了一版 , 那看起来 Google 的模型的质量也还可以 , 希望就是 Apple 在此之上做的模型也还可以吧 。
然后他们维持了原来的系统设计的方式 , 就是说模型分做本地和云端的两条腿走路 , 就是说如果是本地模型能跑的 , 它就尽量在本地模型跑 , 这样能够更好地保护用户隐私 。
本地模型跑不了的东西呢 , 它又可以放到苹果的云端来跑 ,而且它继续强调它的 PCC private cloud compute, 就是说这是一个一次性的云端系统 , 你在 AI 的请求发过去的时候 , 它就创建一个这样的云端系统给你跑 , 跑完了这一个请求之后就立即就完全清掉 , 然后保证不会留下任何隐私的缺口 。
这里我有两个问题 , 第一个问题就是就是号称用了 Gemini 的 foundation model, 它这样的一个用是什么概念 ? 就是在什么样的层面开始苹果自己去弄它 ?
我的猜测是它在上面做 fine tuning 吧 ,但实际上可能也没有人知道细节 。
然后另外的话 , 它这个两层结构我看有一些早期的一些记者的报道是说它觉得做一些简单的工作的时候 ,因为它的模型是本地跑的 , 所以就很快就可以出结果 。
快捷指令22:46
对 , 包括现在你在 iOS 27 的 Shortcuts 里面 , 你现在可以新建一条命令就是跑一个模型 , 然后你已经可以在里面选择说要跑本地模型还是跑云端模型了 。
哇 , 这么高级 , 我在想普通用户知道什么叫做本地模型吗 ?
或许你不知道 ,因为 Shortcut 这个东西也像 vibe coding 一样引入了一个新功能 , 就是大家过去如果用过 Shortcuts 的话 , 都好像要编程一样一条一条指令的加进去 。
就是如果在这样一个情况下那么做那件事情 。
对 , 现在直接弹出来一个空白的对话框说请描述你想需要的 Shortcut, 然后就跟 vibe coding 一样 , 你描述完它就帮你做 。
那我觉得还是帮助大很多 ,因为我之前有帮助朋友去设置过那个 Shortcut, 我作为一个码农 ,其实我在那边要搞清楚那些条件 , 那些触发也是要吃一壶 , 还是要看网上攻略去知道怎么弄 。
对 ,而且它的编辑环境很糟糕嘛 , 对吧 ? 不像我们打开一个编辑器随随便便就可以复制粘贴一段代码 ,在那个环境里面其实编辑起来很繁琐 , 然后现在可以一个 prompt 就创建一个 Shortcut 还挺好的 。
对 , 那像你自己现在用 , 你会觉得说都能满足你的需求吗 ? 因为我用 Shortcuts 用的不是特别多 , 可能就只有就十个左右的 Shortcuts 吧 。
我觉得有些时候我想到了一个我使用 iPhone 想有的需求 , 我发现它不支持 , 就是 Shortcuts 支持的很多东西 , 我觉得苹果它对于很多 , 比如说你 settings 里面的一些改动 , 它不太能够直接在 Shortcuts 里面改 。
对 ,有时候也是要试一下到底你想要的功能是不是 Shortcuts 里面支持的 。
对啊 , 那你现在把它变成一个就是一个 prompt 说我想要什么 , 那我觉得它大概率还是会拒绝你 , 对不对 ?
那也是 , 或者做不好 , 做不出来 。
这些效果可能等要等真实版出来之后大家用一用才说 , 包括其实口嗨也是靠水平的嘛 , 就是可能一个有经过工程训练的人的口嗨 , 可能和一个
一个上了年纪的人的口嗨可能也是不太一样 。
对对 , 那是 。
那刚才提到的一些具体的架构方面的事情 , 那我觉得可能对于每一个普通人来说的理解就是可能就是你可能让 Apple AI 去做一些事情 , 它可能就变得更快一点 ,因为它有些模型是本地跑的 , 然后包括号称就是数据会更安全一点 。
那我就会说就是那个问题就是现在在新的 Apple Intelligence 的情况下, 主要的入口还是我们那个认识的 Siri 吗 ?
还是那个 Siri?
是的 , 现在主要入口还是 Siri, 只是换成了新版的 Siri, 现在新版的叫做 Siri AI,但是我还在排队中, 我还没有这个功能 。
所以你更新了预览版 ,但是你没有 Siri AI 的访问权限 。
对 , 就跟两年前 Apple Intelligence 刚出来一样 , 就是说你更新了 , 然后那个功能不一定你想开就有 ,有些人已经有了 ,但有些人还没有 。
Siri智能25:56
那这次的 Siri AI 和之前我们所熟知的那个 Siri 有什么主要的区别呢 ?
它在一定程度上终于把之前的承诺的 Siri 的功能做出来了吧 , 例如说它能够利用你个人的一些上下文信息来做判断 。Apple 也好像也没有详细说到底能够利用什么信息 ,但至少它知道你的名字啊 , 知道你家在哪啊等等等等的这些 , 包括你过去的 message 收发过的消息 , 跟谁聊天啊之类的这些它是有的 。
然后你可以直接问它谁谁谁是不是约了我哪天吃饭 , 然后说吃饭的时候我顺便要去那里买个东西 , 你能不能帮我做行程规划 , 把要去买的那个东西的地点也在路线上加上 。
就说这些它能够根据内置应用推导出来的信息 , 理论上它都可以访问得到 , 就不再是说一个脱离你个人信息的 Siri, 简单的给你设个闹钟 , 开个灯这样子 。
这个东西就是个人信息的一方面 。 对 , 这个东西我感觉还是得具体他们上线之后大家才能看到它到底有多聪明 。
就是因为感觉这些有会知道上下文这个概念 , 我觉得好像已经说了好多年了 , 具体能够有多知道你是谁这个东西就看情况了 。
我也我觉得应该很担心 , 我估计应该也是停留在 PPT 上面它的智能程度 ,因为它一说它很多东西都是 privacy first, 然后又要 on device, 那苹果的机子它的内存是众所周知的小 , 那它能够跑一个多大的大语言模型 , 它的这个能力是我觉得是非常值得怀疑的 。
如果要把你想你这些个人的资讯去上传到云端的大模型去运作的话呢 , 那就会有很大的资讯安全风险 。
所以到最后可能很有可能还是一个中等的 ,不能说功能上严格的版本 。 对 , 所以很难只期待它有什么革命性的突破 , 除非它把他们的硬件给架构给改了 。
因为感觉就是所谓的保护隐私和知道你更多这两件事情就是矛盾的 。
对 , 苹果一直在解法就是说它端到端加密 , 然后就是只有你自己的设备才能够访问你自己的信息 , 苹果是没有办法访问你的信息的 。
所以那它能够做的事情都很就很有限 , 所以它为什么要那么强调这种 edge computing 端侧计算 , 就是为了这个原因 , 为了保证你的所有的信息都只在你的 iPhone 上面去进行处理 。
包括我想到之前在 Meta 工作的时候 ,WhatsApp 它一直很有名的就是它要说的所有东西都端到端加密嘛 。 那时候就跟他们的做一些商业化的工程师聊天 ,他们就觉得哇这个事情就是所有东西都基于端到端加密 , 所以做任何的功能都变得比其他地方要难很多 。
所以就导致在这样的一个平台上面做一些方便用户的 fancy 的功能就是很慢的 。
是的 , 根本做不出来 , 就是被物理条件限制了 。 你如果要加硬件 , 加内存 , 加你的计算能力 , 那么你的电池又会被受到限制 , 所以等于是陷入一个不可能三角 。
我看那个好像它的演示还提到那个关于上下文这件事情 , 它可能现在可以读屏了是吧 ? 就是可以看到你现在在看的那个屏幕是什么样子 。
对 ,他们演示的就是说你看我的 Instagram 上面好友发了张照片 , 这个景色这么漂亮的地方在哪里呀 , 然后 Siri 就帮它说出来了 。
我看这个功能其实我自己是用安卓的嘛 , 安卓其实它那个 Gemini 在安卓上面本身就有这个功能 , 然后我觉得还挺好用的 。
我举个例子 , 我自己用了一个非常喜欢的功能 , 就是我在刷小红书的时候看到那种种草帖 , 说哎呀我去这个餐厅吃饭好棒哦 , 然后我就可以把 Gemini 唤出来 , 然后把它那个餐厅划一下, 它就说哦这个餐厅是这个地方 , 然后它跟 Google Map 连接的嘛 , 我就说我把它存起来 , 就非常方便 。
对 , 我也觉得什么时候它能够控制我屏幕滚动就更好了 , 那这时候那些信息流的应用 , 什么 Instagram 啊之类的 , 我甚至都不需要自己看了 , 我直接就说你操控我的屏幕去看吧 , 看完你觉得符合我口味的你就推荐给我 ,不符合的过滤掉 , 广告也帮我删掉 , 对吧 ?
那我就连广告都不用看了 。
就是帮我刷两分钟 Instagram, 然后有什么有意思跟我说 , 没有了就不用了 。
对的 , 我觉得这才是我想要的未来 。
未来就是 Agent 帮我刷屏 , 帮我刷 Instagram, 帮我刷 Facebook, 然后帮我回复朋友的贴纸 , 帮我去祝贺朋友的生日, 然后朋友也是用 Agent 去看 Gemini 发来的信息 , 然后就纯纯的变成一个 Agent 的 social network。
但是现在这个版本它并不能够操纵具体的 app,是吧 ? 它只是读里面的内容 。
对 。
然后我之前跟 AI 聊天的时候 , 我不清楚是不是真的 , 就是说因为我在问 AI 说这个功能本身它只是截个屏去读屏幕上的内容 , 还是说它具体的访问到这个软件的架构 ,因为 Apple 作为一个系统级的这样一个东西 , 它其实是知道这个 app, 它比如说这个是菜单 , 这是按钮 , 它可以不用只是非常暴力的读这张图来知道东西 。
对 , 理论上是的 ,但好像在 demo 里面没看出来这么有深度的功能 。
OK OK,因为之前我有朋友也是做那个 accessibility, 就是辅助功能的 ,其实这些东西都在里边 , 就是为了盲人知道 , 它会开发者会告诉 app 标注说这是按钮 , 这是干什么 , 这是干什么 ,其实这些内容理论上来说都可以被 Siri 所访问到 , 它能够知道这个界面在干什么 。
有一些 computer use 的 AI app, 它只能在 Mac 上面跑起来的原因就是因为 Mac 有这种 accessibility 的 API, 它可以直接读屏 ,也可以直接操作按钮 , 这个是苹果的生态系统一直以来都有的功能 。
然后现在其实有了 AI 之后就顺便很巧就可以让 AI 去用这些东西了 ,但是就是所谓的 computer use, 就是操作电脑或者说是操作 iOS, 就是目前就演示来说 ,Siri AI 还不能做这个事情 。
那我觉得应该是受限于它的智能还不够强大 , 然后又不想把这些数据传到云端上面去 。 我怀疑 Gemini 这个方向最有可能的 integrate 的形式就是它说它可以 ,Siri 可能会在特定的场景就跟你说要不要到网上去查一下, 我帮你到网上问一下, 然后你允许了它 , 它才会问 。
然后除了刚才提到那个 Siri AI, 它现在变得相对来说更有一些上下文 , 能知道你是谁 , 同时可以读屏幕之外, 还有什么 Siri AI 的新的更新呢 ?
它终于出了一个 Siri 的应用 , 我觉得这算是追赶上了其他 AI 应用的交互模式 , 就是以前 Siri 好像一个背景的存在一样 , 你召唤它 , 它就弹出来一下, 然后天你甚至把过去的聊天记录找回来都是找不到的 ,因为它就消失了 。
然后现在终于有一个类似于 ChatGPT 啊或者 Claude 这样的应用 , 就是你可以把它召唤来说 , 我去跟你聊过的东西你是不是都有历史记录啊 , 来我翻看一下, 或者把某个对话继续进行下去 。
然后以前的 Siri 也是只能够语音或者文本交互 , 那现在它要做到一些类似其他 AI 的功能 , 那是不是应该允许我上传一个附件 , 例如贴一个图片给它 , 对吧 ?
那新的这个 Siri 的应用终于可以支持这种其他 AI 都支持的功能了 , 就是加一个附件给你 , 你帮我修一下这张图 , 或者你帮我看一下这个文档 , 然后审查一下这个合同行不行 , 对吧 ?
那这个终于可以做了 。
现在你打开你的 iPhone, 就是除了之前下载的什么 ChatGPT 啊豆包之外, 它现在突然出现个图标就是 Siri, 点进去基本上也就是一个聊天框 , 还有一些历史聊天这种东西 。
对 , 然后在生态上, 它当然可以把 Apple 的生态利用起来 , 做得比其他家的 AI 要好 。 一个方面是它能够做到你的手表上, 你在 Apple Watch 上面发起的对话 , 你可以在其他设备上继续进行 , 你在其他设备上发起的对话 , 你也可以在 Apple Watch 上面继续的进行 , 或者翻阅已有的内容哦 。
那这是很多其他的 AI 现在都还没有来得及的事情 。 然后还有一个非常非常少人会用到的 , 就是大家还记得苹果有个设备叫 Vision Pro 吗 ?
OK, 算是 。
对啦 , 差不多要停产了 。
对啦 , 如果你还记得苹果有个这样的设备 , 那在里面呢也有专门的 Siri 可以叫出来 ,而且叫出来之后还非常的可爱 , 是一个悬浮在半空中的一个小球 。
就是在空间中的球 。
对啦 , 它看起来样子有点像你在 iPhone 上习惯的那个 Siri 的球 ,但是它是立体的 , 悬浮在空中 。 我本来听你说这句话的时候 , 我还在期待像豆包一样 , 你可以在三维空间上那个钢铁侠里面有个蓝蓝的透明的一个人形在那边 。
那这样之前像 Claude 它可以有一些 ,因为 OpenClaw 很火嘛 , 所以它就会有那个 dispatch 功能 , 就是如果你电脑开着的话 , 那我远端可能会用手机可以遥控让电脑去跑 AI 去做一些事情 。
我不知道这个 Siri AI 可以吗 ? 我怀疑是可能还没有开始做吧 。
其实 dispatch 可能最重要的是你可以有定时执行的功能 , 然后我没有看到它说 Siri 有什么定时执行的功能 ,但如果你要做的话 , 刚刚我们提及的 Shortcuts 可能是一种做法 , 就是你希望定时 AI 去帮你做某个事情 , 那么你可以做成一个 shortcut, 这个 shortcut 例如说每 10 分钟跑一下怎么样 , 然后让它去调一下模型 , 然后做某件事 。
然后 shortcut 位置还加了一个存储功能 , 就是以前 shortcut 跑一遍 , 跑完下来你的信息都丢了 , 对吧 ? 你再跑第二遍 ,其实你是没办法传承你上一遍跑的时候的任何信息的 。
那么 shortcut 在 iOS 27 里面加上了存储的功能 , 你可以把上一遍跑过的信息存下来 , 下一遍你可以读出来 , 然后就是有针对性的调整 。
有点抽象 , 你可以举个具体的例子吗 ? 这个存储能怎么用 ?
他们的其中一个讲座就是说 , 你可以告诉 AI 你喜欢吃什么样辣度的汤 , 然后呢它就去周围就是有面包有汤的这种店搜给你看 , 然后呢你还希望说不要永远都喂我吃同一款汤 。
那怎么办呢 ? 那它肯定要记过你最近吃过 , 它建议过你去选购的某个款式的菜 , 对吧 ? 那么它记下来了 , 它才能够知道下一次不要总是推荐同一个给你 。
了解了解 , 这可能跟刚才说的 Siri 有 context 可能也有关系是不是 ?
对 ,但是它属于专门在 shortcut 里面存下了一个信息 , 使得它推荐的时候可以避免重复 。
了解 , 除此之外我记得我看那个视频演示的时候 , 它还重点提到了就是你 Siri 现在有一个新的入口 , 就相当于是当你看到通知的时候 , 你不是看到通知之后你肯定往下拉嘛 ,在联动到往下拉 , 你看到那个通知可以再往下拉一下, 然后这个时候就触发了 Siri。
对的对的 , 可惜我还没有新的 Siri, 所以我没办法试用这个功能 。
我看它那个演示的时候是比如说 , 我的 app 跟我说有个通知嘛 , 说谁谁谁跟你说了一句话 , 这个时候你可以马上再拉一下召唤 Siri, 然后跟 Siri 讨论说它跟我说这个 , 那我该怎么回它之类的 , 相当于是一个比较方便的跟通知绑定的这样的一个入口 。
然后还有另外一个挺有意思的事情就是 , 它在演示的时候还提到就是 , 比如刚才有提到 Siri 可以看到屏幕上的内容嘛 , 然后这个时候你可能跟 Siri 去说 , 比如说帮我根据当前我屏幕上的他们聊的那个内容创建一个日历 , 那可能 Siri 可以调用日历的 app, 然后把相应的那个日历的创建出来 , 相当于是通过 Siri 可以把你已经装了那些 app 的一些功能能够这样瞬间
的在后台去调用它 。 然后我看了一下 ,其实关于 Siri 去在后台调用其他的 app 这个功能 ,其实好像是 2022 年就已经加了这个功能 , 那时候 Siri 刚推出的时候就已经在说 , 你看你可以跟 Siri 聊天说 , 比如说我要订一个什么什么酒店 , 那它就可以 Siri 就可以直接调用你下载的 , 比如说某个酒店的 app, 然后去把这酒店给订好 。
这个 Siri 调用其他 app 的这个能力其实很早以前就已经有了 ,但是我看网上说这是因为之前的 Siri 实在太蠢 , 所以虽然有这个功能好像也没什么人用 。
应用意图39:40
好像是的 , 就是它一直都有 App Intent 的这个功能 , 就是让你的应用的作者来告诉 Siri 你这个应用能够执行一些什么样的操作 ,而且这些操作都是 Apple 提前定义好的 , 就好像订车订酒店等等的 ,不像我们现在 AI 可以随便描述的一个 skill 这样说 , 我用自然语言随意描述一个东西 ,以前都是绑定的 , 就是非常具体的若干操作 , 现在可能 Siri 强大了吧 , 就调用这
些会更方便一点 ,但我也不知道 , 我以前也基本上不让 Siri 来做这种事情 。 我个人的习惯还是就是我要订车我就找到具体的哪个应用去打开 , 然后我还会比较一下到底 , 比如说 Uber 和 Lyft 现在哪一家更便宜 , 对吧 ?
然后我再去订那一家 。
这就让我想到最近一年可能大火了这样的一个 agent 或者说是 MCP 这样的一个东西 , 就简而言之介绍一下就是 MCP, 相当于是每一个服务可以通过一定的新的方法来告诉 AI 说我其实可以做这么一些事情 , 比如说我可以订酒店 , 我可以订飞机 , 我可以查天气 , 然后到时候用户跟 AI 在聊天的时候 , 当聊到相关的请求的时候 ,AI 就知道你要订酒店是吧 , 那我就用你这
个服务 , 就这样的一个功能 。其实我平时在工作中用 AI agent 其实这件事情还是非常经常的会去用的 , 比如说我会跟 AI 说我用的是程序员嘛 , 我可能会跟 AI 说你看一下我们最近的数据周报 , 看一下哪个数据有异常 , 比如数据周报是一个单独的一个服务 , 你去调用一下它的一些功能 , 看一下有什么哪里异常 , 然后你看一下我们的代码是不是哪里
有问题 , 如果有问题的话 , 那你可能调用一下创建任务的这样一个服务 , 创建一个任务怎么样 , 然后把这些东西都串起来 , 然后通过这样的一个 MCP 的东西 。
我不知道是不是 Apple 现在有了更聪明的 Siri, 通过这个 App Intent 可以做到类似的事情 。
不确定了 ,因为以前的 App Intent 真的就是绑定在若干 Apple 固定的类型上的 ,MCP 现在我们都知道是很开放的嘛 , 对吧 ?
就是你可以用自然语言随意的描述你这个 MCP 可以做什么 , 然后一个 LLM 自己来决定什么时候要调某个 MCP,不知道苹果能不能发展到那个地步去 。
那你刚才提到 App Intent 苹果定义的一些方式 , 比如它会定义什么 , 它会非常死的是说只是处理图片怎么样还是什么 ?
对 , 过去的 App Intent 是就是好像订酒店就订酒店 , 订车就订车 , 订吃饭就订吃饭 , 好像是这样说死的 。
就 Apple 自己给你列出来一些你可以做的事情 。
我最近都没有去研究它的有什么新的 SDK 的 API,以前呢它就是只能发一个 intent, 基本上它能承载的信息跟一个 URL 差不多 , 然后就说比如说它要你 , 它要你这个 Facebook app 打开 , 然后发一个帖子是吧 , 然后它只能做到就是说我把这个帖子的一些内容发给谁 , 提前给你填好 ,但是呢后面的一些操作都是要人工进行的 。
就是我的点是说如果它这个 SDK 它没有把它改造成像 MCP 或者 CLI 命令行这种更加强大的交互格式的话呢 , 那 Siri 它从交互上就基本上不可能去做特别智能有意义的事情 , 更不用说前面的它还是要做硬件的端侧计算 , 我觉得这个技术上来说实在太过困难 。
然后还有一个很好的 benchmark 就是说比较就是说你看看 Google 它已经没有任何束缚 , 它可以在云端计算 , 它什么的 , 它有也有最强大的模型 ,Gemini 是它自己加的 , 它有做出来什么特别好的 AI 产品吗 ?
也没有啊 。 所以我觉得期待苹果能够做的比 Google 更智能 , 我觉得应该是不太现实的 。
我自己看到这个它在那边在推这个事情的时候 , 我的想象就是比如说我平时记日记的或记笔记的时候会用 Notion, 我的希望是说我在比如说跟朋友聊天的时候 , 突然聊到一件事情 , 我会跟 Siri 说你帮我把 Notion 里面的某个地方你帮我记一下这样一个事情 , 它就可以找到这个第三方的 app, 然后把这些东西给运过去就搞定这个事情 。
没错没错 , 我现在也用 Claude 和 ChatGPT 在 Codecs 的跟你说的一样的事情 , 所以我的推测是它至少我们可能还要等个几年, 或者等到它的计算能力在端侧的计算能力变强 , 或者是它解锁了云端部署去操作手机 ,不然你说的这个它应该是 Siri 应该是很难做到的 。
所以那个世航你的 point 还是因为 Apple 因为端到端加密的问题 ,以及它本地模型它本身那个很小就不可能 。
从哪里去 。
非常困难 ,但是它这个概念可能也是一个试水吧 , 可以获得一些有意义的用户反馈 , 看看大家是不是都去尝试 , 想要让 Notion 去做一些改动啊 , 然后发现做不了 ,但是它至少验证了需求是存在的吧 。
也就是虽然像 Cat 也没有 Siri AI 的访问权限 , 所以我不知道它有多好 , 就是也有可能就是现在这个版本的 Siri AI 还是不能够实现它号称它能实现的东西 , 当然再过两年的 WWDC 它说我们 Siri AI 又有了新的版本叫 Siri Power AI, 所以可能还是要做同样的事情 。
对 , 就是我们成功的把大模型把千问运行在了一个苹果手机上面就差不多 , 把一个 8B 的模型 。 然后它有 50K 的 context window, 那如果它能够把这么一个模型硬给它塞到了一个苹果手机上面去的话 , 那这些说的都不在话下 。
好像说它现在塞进去的方法是用 MoE, 就是跟 DeepSeek 一样 ,mixture of experts, 这样使得它一个 prompt 进来 , 它只会激活这个模型其中一部分 , 就是对应的那个 expert, 然后这样子它可以就是说一个大模型实际使用的内存更像是一个切片之后的一个小模型一样 , 据说是这样做的 ,不知道是不是真实 。
应该是 , 就是把所有能够省内存的招数都给它用上了 。
我查了一下原来 App Intent 是没有白名单的 , 理论上是任何的 app 都可以定义任何自定义的 intent 的 , 所以就看 Siri 的理解能力了 , 能不能理解那个 intent 是什么 。
所以它现在也是变得比较灵活 , 就是我可以纯粹自然语言去描述说我能够用哪些功能 。
是吗 ? 就是说它现在因为 Intent Handler 很早就有 , 我也写过 ,但是是不是说现在 Intent Handler 就是它有点像类似一个服务器 , 你给它加上一些备注说这个 intent 到底是做什么用的 , 然后 Siri 它就可以去读取 , 那它就可以像 MCP 一样跟人类交互 。
这个 actively 做 iOS 开发的人来回答一下我们的问题 。
我觉得可以利用一下我们 iOS 的老的开发经验 , 试一下做一个 iOS 上面的 CLI, 然后它就纯用 intent 跟看看 Siri 能跑到什么地步 。
我觉得之前世航说的那个问题还是挺真的 , 就是在 Apple 的这样的构架下面 , 它真的能够有多 Siri 能有多聪明 , 还是一个挺令人不担心的事情 。
是的 , 所以我是很理性的果粉 , 我绝对不会用安卓 ,但是我是很理性的 ,不会因为一些小挫折就放弃苹果 。
那我好奇就是因为 Google Gemini 肯定是很聪明的一个云端模型嘛 , 所以我不知道安卓的用云端的 Gemini 去操作手机这件事情本身做得怎么样 。
你们有看 Google I/O 吗 ? 就我所知好像也没有 , 没有真的落到实处 , 一定都在 PPT 上面 。
刚刚提到那个千问 , 突然我想起来就是网上的有笑称说这是对中国区更新最少的一次 WWDC,因为刚才我们提到的所有 Apple Intelligence 的功能 , 目前对国企都不开放 。
对 ,而且听库很明显的说 , 对于欧洲是可以想办法开放的 , 对于中国是因为合规原因没办法开放 , 已经说得这么直接了 。
对 , 包括刚才提到这次这么深入的集成 Gemini, 就是把这件事情能够多容易的替换成国内的国产模型 , 我觉得还是一个非常非常令人头疼的事情 , 让你觉得好难 。
对 ,因为它要基于国产的模型来重新做 fine tuning 嘛 , 如果它还是走同一条路的话 , 那效果就很难说了 。
而且更重要的就是说 , 如果 AI 交互中出了问题 , 到底谁背锅嘛 。
是 , 到底是算 Apple 的锅还是国内国产的锅 。
你是说出现了敏感词内容 , 到底谁背锅的问题 。
对的 , 这个锅不能确定谁背 , 这个产品就做不出来 。 包括我还在想就是合作模式方面 , 就是 Apple 就我所知可能国内的工程团队也没有很多 ,他们如何能够把这么需要深度集成的一些东西跟国内模型去合作 , 我感觉还是个挺头疼的事情 。
这倒是花钱能解决的问题 , 就是它这次 Apple 的大模型基于 Gemini 来做的话 ,其实花了很多钱给 Gemini。
Safari49:44
刚才我们聊了 Siri AI 的功能 , 那除了 Siri AI 之外 ,其他还有我看到它有提到说方方面面的各种 app 都做了一些 AI 的强化 , 那还有哪些 AI 的强化 ?
例如说在 Safari 里面 , 你现在可以用 AI 把你很多个网页的 tab 归纳成不同的主题了 , 这个是一个 Arc 浏览器很早就有的功能 , 对吧 ?
然后 Arc 浏览器这个功能有了一年多了吧 , 可能 , 然后终于 Safari 超过去了 。 然后还有一个我感觉非常有用的功能是它可以监控网页的变化 , 就是你想想以前很常见的是我们要刷一个什么考试的空档啊之类的东西 , 对吧 ?
我们都很熟悉的问题 , 就是要装一个监控网页变化的一个浏览器插件 , 然后把电脑长期开着让它在背后一起刷 , 然后现在这个功能可以在 Safari 里面进行了 ,在你的手机就能做 , 你向 AI 描述一下你想要刷得到的网页的变化 , 然后它就在后台默默给你刷 , 刷到了再弹一个推送告诉你 。
感觉是一个抢票 , 特别是适用于抢票的东西 。
对的 , 这肯定也非常有用 。 然后说到了要装个浏览器扩展这个事情 , 跟刚刚所说的写一个 prompt 创建一个 shortcut 一样 , 现在也可以写一个 prompt 就帮你创建一个浏览器插件了 。
等一下 ,是创建一个插件还是找到那个商店里面已有的插件 ?
我没理解错的话是创建一个插件吧 。
那我觉得还是蛮厉害的 。 小 vibe coding 相当于是 。
对 , 你想想你的 Xcode 都可以 vibe coding 了 , 它给你 vibe coding 一个浏览器插件应该还不是很难吧 。
就对于普通用户来说 , 它就可以口嗨说我要装个浏览器插件 , 这样的话它看到什么相关的网站的时候 , 它可以把网站上的内容怎么去修改 。
对的 , 然后还有一个功能是一键修复所有泄露了密码的网站 , 就假设你使用 Safari 来保存网站密码的话 。
就它可以自动的帮你去更新那些网站密码 , 那感觉还是挺麻烦的 ,因为大家知道如果去不同的网站去改密码的话 ,其实不同网站它的流程也不一样 , 这个可能点这里 , 那里 , 它可能要点到什么账号 , 再点到密码再改 , 就是好多步骤 。
对的 , 然后它现在告诉你说我一下子可以把你全改完了 , 这还是挺好的 。 那它怎么做到呢 ? 它也是用 AI 去打开那个网站 , 然后去搞清楚那个网站怎么登录 , 然后再去尝试去你的账号设置那里找到改密码的那个地方 , 帮你把密码改了 , 这还其实挺需要 AI 的这个像是桌面的 use browser 这样的能力来操作吧 。
对 ,因为这个事情感觉还是有点难度 , 我好好奇就是你是说你会看到那个 AI 在点这里点这里点这里点这里 , 还是它就默默在后台把这些事情做了 ?
不知道的 ,因为没演示过 。
那现在比如说像 Chrome 或者说之前 OpenAI 他们推出的那个浏览器都会特别的去秀那个功能 , 就是你在旁边可以开一个 Gemini tab, 然后你可以就网页内容跟它进行一些问询 , 包括它可以用到网页去点这里点那里这些功能 ,Safari 之前介绍它也可以做类似的事情吗 ?
好像没有说呢 。
所以还是相对来说是一些比较辅助的功能 。
对的 , 它没尝试让你控制 Safari, 它只是说 Safari 可以自己控制自己帮你完成上述任务 。
听起来这些上述任务还是蛮简单的 , 就是比起它真的帮你弄这些东西之外, 除了 Safari 这些变化之外, 还有什么其他的 app 也有 AI 增强的 , 比如图片它这次有什么新的功能吗 ?
照片与iCloud53:50
图片的话它现在主打三个工具 , 一个是已有的工具 , 就是英文叫做 clean up,其实就是帮你擦除掉画面上你不想要的一个物体或者一个人嘛 。
有些人实测效果说比以前好 ,但我试了一下我觉得效果还是不太行 。 我不知道是不是因为我还没有新的 Siri,但理论上那张图也是走了新的流程一样 , 感觉是不是发给了一个服务器端来做的 ,但擦除效果就是不太行 , 就是擦除了之后它会导致填充进去的内容不准确 。
就是不合理 , 模模糊糊什么之类的 。
对 ,因为你擦除了一个东西 , 你就要在它的位置填充其他合理的东西进去 , 对吧 ?
是是是 。
然后我现在看起来擦完了之后它填充进去的东西不合理 。
这个很奇怪 ,因为其实擦除这个功能 , 比如说安卓那边 , 比如说我自己用三星嘛 , 它其实这个功能一两年前就已经很好了 , 就是它最后还原出来的图片已经几乎是没有什么缺点 ,不知道为什么 , 可能是刚因为苹果的架构 , 包括隐私性的原因 , 导致它现在还做不好这个事情 。
对 , 然后第二个功能是 extend, 就是扩图 , 就是你这张图的四周你想要扩展出来 ,也是个填充功能嘛 。
这个我不知道听众怎么想 , 我是觉得这个功能苹果难道还没有做吗 ? 这种感觉 。
对 , 然后第三个功能是 spatial reframing, 就是在空间上重新取景 , 这个功能看它的演示效果很好 , 实际用起来感觉一般般 , 主要是可调整的范围有限 。
这个我看那个演示视频大概它举个例子 , 比如说你看到你家的猫猫 , 然后你打开这个功能之后, 就可以把这个猫猫稍微变得 3D 一点 , 你可以稍微调整一下, 比如说镜头往左边一点 , 往右边一点 , 那猫猫和背景的那个也会有这样 3D 的效果的一个变化 , 然后你再可以重新拍这张照片上的这个立体 。
是的是的 , 然后因为你的猫和背景之间角度调整了 , 所以你猫原本遮住的背景就会可能有一部分暴露出来 , 对吧 ?
它就要重新填充那一部分 , 然后就跟擦除一样 ,但是这个填充我试了一下效果倒还好 。 我唯一觉得不满意的就是这个摄像头的角度能调的范围非常的小 。
给我感觉好像这是以前的空间照片的一点点小变化 , 相当于是 。
对 ,有这种意思 。
因为空间照片是说我本来一张照片 , 那我现在可以用一些 AI 的技术把它变成一个 3D 的 , 我可以左看看右看看 , 现在是你左看看右看看之后, 你可以点击拍照 , 它就把它变成一张新的照片 。
是的是的 。
了解 。
就是它在演示的时候 , 它调整的那个角度还挺大的 ,但我实际在手机上操作的话 , 它会锁住我能够调的角度 , 转不了那么大的角度 。
而且我看那个相关的报道是说这个功能 , 这个系统随时可以打开的功能 , 它每天还是有次数限制 。
对 , 如果你购买了 iCloud Plus 的服务 , 据说你的使用次数会多一些哦 。
这 iCloud 这个农民大爷现在也开始搞这套东西了 。
Usage based building, 就是现在 AI 的收费模式 。
因为之前 iCloud 我理解的话 , 就是还是一个比较传统的纯粹的一个云端存储你的文件照片这样的一个功能 , 所以现在意思是说现在 iCloud 的那个服务本身的内容进行扩充 , 就是除了存储文件之外, 还会给你一些 AI 相关功能的一个访问权限 。
或者是限制你的次数吧 。
因为我看隔壁 Google 家就是在干这个事情 , 就是比如说你买那个 20 美金的那个 Pro 服务的话 , 那么我们顺便送你 2TB 的存储 , 就是有些人会说这个很烂 ,因为比起 Cloud 或者是 ChatGPT 的 20 美刀 , 它就是纯粹的用 AI 的那个功能 , 它没有额外的那些服务 。
这个功能我才刚买了 , 你知道吗 ? 我们这期节目的提纲我写着写着 , 它就告诉我你的 Google 容量没了 , 连提纲这个 docs 都不能改了哦 , 然后我无奈之下就只能去升级一个 , 买了个 AI Plus, 把我的容量提上去才能继续开 , 太搞笑了 。
就是对于业界来说 , 这可能是方向 , 就是相当于是平时那些提供服务的东西 , 比如说像 iCloud, 包括 Google Drive 的那些空间 , 本身就会越来越和一些 AI 的功能进行整合 , 就是你得买额外的 Pro 的服务才能够接触对应的功能 。
对 ,因为大家都想要捆绑售卖嘛 , 如果不捆绑售卖 , 你说纯 AI 是有这样的套餐 , 对吧 ? 买容量又是那样的套餐 , 然后消费者可能就更难做决定到底这个套餐买什么 , 那个套餐买什么 , 然后还不如捆绑起来作为一个大的套餐来卖 ,有点像 Apple One 的思路跟 Google One 的思路都是捆绑购买 。
了解 , 那除了照片的这三个实在是有点似曾相识的功能之外, 还有什么其他的 app 也得到强化 ?
有一个很有意思的功能是说你用手机拨号的时候 , 它会尝试寻找你拨打的这个号码相关的更多信息 , 例如你打个电话给航空公司 , 然后它就立即想起来你是打给这家航空公司 , 我去翻翻翻翻邮件 , 翻你最近订了这家航司的票 , 然后告诉你说我把这个投在屏幕上了 , 你是不是要改票啊 , 或者询问跟这个航班有关的事情啊 , 我把这个
电话与信息59:15
打在屏幕上就给你一点便利 。 我觉得这个看起来还是有点用的 , 假若你还在通过打电话解决问题的话 。
那我突然在想会不会一些很奇怪的情况 , 比如说我的对象在我面前拨打了我的听头的电话 , 这个时候 Apple 把我们之前的聊天记录给翻出来 。
应该不至于吧 , 我知道这不是一个客服电话 。
这个让我感觉就是也是刚才提到的 Siri 会有你更多的上下文 , 可能就是一个辅助功能 , 就是你在打电话发消息的时候 , 它就把你一些相关的信息给找出来给你 。
对的 , 现在最后一个我觉得值得提一提的是在你的短信应用里面 , 你收到的短信它会给你一些操作的提示 , 说你要不要把这个存下来啊 , 或者是要不要创建一个日历之类的东西吧 。
然后或者对方问你一件事情 ,AI 理解说这个事情你可以通过分享照片来回复对方的 , 它就直接提醒你说你是不是要做一个这样的照片搜索啊 , 要不我直接帮你搜了 , 把照片回复过去吧 。
这功能给我感觉也是属于那种似曾相识 , 可能在之前几年的 Google 或者是哪里的演示的 IO 之类的也会展示过这个概念 。
对 , 都不是一些就是非常有突破性的东西 ,但是也非常符合 Apple 的设计意识吧 , 对吧 ? 就是把小的东西打磨好 。
那我包括我看到再次老生常谈的就是帮你重新修改一下你的 email 这个功能 , 我是很难想象 2016 年还在演示这个功能 。
AI日常1:01:29
那这里顺带一提 , 我有个问题想问各位 , 就是把 Apple 的这些功能放在一边 , 就是到现在这个时间节点 ,2026 年的年中, 就是你在平时的日常生活中真真实实的用到了 AI 的功能来提高你的体验 , 会有哪些什么样的情况呢 ?
生活中而不是工作中 。
一定要跟 Apple 相关吗 ? 还是跟 Apple 本身 ?
不 , 跟 Apple 可以没有关系 , 我们可以作为一个以后我们可以期待什么这样的一个前瞻 。
我觉得现在最有帮助的就是我用 AI 整理了我过去发表过的众多内容 , 例如说我在博客上发过的文章 , 我在知乎上获得至少 1000 个赞的回答 , 然后当然我也把我们的播客所有内容都做成了文字稿 , 然后放进去了 , 然后形成了一个巨大的知识库 , 然后这个巨大的知识库现在最好用的地方是让它来帮我起草知乎的回答 。
那我觉得这个还是相当于是偏工作类的嘛 , 那纯生活类的有什么你觉得现在已经很不错的一个体验的一个事情 ?
我觉得 AI 有时候会在一些特别紧急的事情上面会有一些帮助 , 就比如说你去旅行 , 你需要找一个什么东西 , 或者我在迪士尼逛得很累了 , 然后我需要研究怎么交通方式可以回去 , 那这个时候我现在还是要再用 ChatGPT, 用 AI 来去帮我去找这些信息 。
它是因为它会在网上上面把前任的信息都汇总起来 , 然后去做一个研究 , 然后告诉你你去你出门左边就有一个 taxi stand, 你就可以在那边等 , 打到 D, 然后打 D 跟 Uber 是差不多的 , 就会有这些非常有用的信息 。
前面那个打电话的时候给你找到信息 , 如果是真的有用的话 ,有用的信息那应该也是非常有用的 , 就比如说问你你要填个信用卡号 , 然后你没准备好 , 你的保险卡号你没 , 然后它给你告诉你 , 又或者你的对象然后突然间提醒你今天是生日 。
对 , 你对象问你说你还知道今天是什么日子吗 ? 这时候 AI 可以提醒你 , 然后给你十个候选 , 这是十个可能的日子 。
刚 Vindy 有想说什么 ?
恰巧我也是想说这个在旅游的旅行的计划上, 它给的帮助还是非常多的吧 ,因为现在就是我觉得像现在你想去一个地方旅游 , 想看一些攻略或者查一些东西 , 感觉互联网上噪音也太大了 , 信噪比太大了 , 你针对一个问题想找答案 , 如果没有 AI 来帮你总结的话 , 感觉耗费的时间还是可以非常多的 。
所以我觉得在计划旅行的时候 ,以及在旅行的过程中都非常有用 。 对 , 比如说之前我想要搞一个申根的签证 , 然后要怎么做计划这件事情上, 它就给了我很有用的一个建议 , 就比如说我要申请法国的签证 , 那么我的这个行程单最好就不要就是就只在法国 , 哪怕我真是去玩的时候是会好几个国家 , 那确实会大幅度的简化我的这个申请的那
个材料的准备啊什么的 。 对 , 我觉得这就是一个很有用的建议 , 然后如果不是 AI 这么告诉我的话 , 我可能就会非常老实的搞一些很复杂的东西 , 然后最后又要取消半天的 , 对 , 就很麻烦 。
那这些东西仍然是 Chat。
对 , 我的 dimension 是说我的这想法就是说 AI 应该去多关注 AI 能够帮助你解决哪一些重要紧急的事情 , 然后那些不重要不紧急的 , 它就介绍很多这种 , 比如说照片它可以帮你填充一下, 那它就不是一个特别重要紧急的事情 , 说实在话 , 更偏向于一些休闲的应用 , 那你就很难会觉得是说它 AI 会给你带来什么帮助 。
但是如果像刚刚说的去旅行或者做准备帮你收集信息 , 这种一般往往都是要么重要要么紧急 , 或者重要紧急的 , 那么它很容易就会给你感觉到 AI 确实给我的生活带来很大的便利 。
像我自己的话 , 感觉现在有一些 agent agentic 的 flow 可能对我来说帮助到我的日常生活 , 比如说我平时用 Gemini, 比如说我要订机票的时候 , 我就可以非常口嗨的说我要怎么怎么样机票 ,因为 Google 可以直接连 Google Flight 嘛 , 它就可以根据我非常特别的这样的一个描述 , 包括我说我在哪个航司是怎么样 , 然后能够帮我去找到一个相对来说比较合适的飞机 , 这个之前在 search 很难
做 ,因为它需要做好多好几个好几步把这些信息给进行汇总 。
对 , 我觉得 Gemini 还挺好用的 , 甚至就是我在家里 , 我想收拾家吧 , 我也是会叽叽喳喳说一堆吧 , 然后说我家好难收拾 ,其实某种程度上是个抱怨 , 然后完了它就给我理性一个思路说你可以从哪里开始啊 , 你千万别做什么呀 , 对 ,但确实也是个 Chat, 我觉得没有那么的 , 我没有用到它那么多 fancy 的功能 ,有时候它会很喜欢给我画一些图表呀 , 或者写
一个小的在 Gemini 里面 , 它会做一个小的 app, 我给你 visualize 一个什么东西 , 给你个视图 , 然后你可以按按 button, 你可以按几个按钮去调参数什么的 , 我觉得它有些时候在做一些很多余的事情 , 我还会跟它说你不要动不动给我乱画这些东西 , 我不感兴趣 。
我另外的话可能最近用了一个比较 agentic 的事情 , 就比如说我发觉我们家的保险很贵 , 那我可能就让 AI 说你帮我找几家 , 然后 AI 就会自己去找几家其他的保险公司 , 然后自己就是 cloud cowork 嘛 , 然后操作那个浏览器 , 然后在各个网站上面去点点点点点 , 把我的一些家里的信息填入进去之后, 最后得到一个 quote。
哦 , 那很不错哎 。
但是这个东西 Shortcuts 目前来说 Shortcuts 特别快 , 基本上没弄一会儿它就说那 20 块钱那个 token 就用完了 。
嗯 , 那人家就是这么赚钱的 。
就是有没有什么特别紧急的或者重要的事情呢 ,在你的日常生活中, 我还可以想到最近一个例子 , 比如说我们家里种了一些花 , 然后它出现了一些病虫 , 那我不知道怎么样处理 , 那我如果 AI 能够 ,AI 我就对它拍一个照 , 然后它告诉我是什么情况 , 那它就帮我解决了一个很紧急的事情 。
至于它具体用什么方式解决 ,其实并不重要 , 只是说现在一般来讲 , 现在貌似就只有聊天功能 , 它是能够足够 generalize 去帮你解决紧急重要的事情 ,但是我相信应该以后它可以更加有更加好的交互方式 。
嗯 , 可能我自己的期待就是能够更快的可以变成我跟 AI 口嗨 ,AI 帮我去做一些繁琐多步骤的事情 , 比如说另外一个日常的情况 , 比如说我拍一张照片 , 我在所有社交网络上面都要发一遍 。
听起来你没有用 AI 去做一些比较深度的事情 , 可能还比较 adoption 比较会比较慢一点是 , 我甚至还会用它是说去怎么样去跟父母聊天啊 ,因为我知道父母是什么样的人啊 , 然后让 AI 帮我想一些话术啊什么的 , 那这种就是非常重要的在生活里面去非常有用的事情啊 。
然后我最近还看到另外一个新闻是讲腾讯微信好像在尝试要做自己的 AI agent, 比较有意思的点是在于大家知道国内小程序很多 , 然后小程序都是活在这样一个微信生态上面去的 , 所以理论上来讲它的 AI 可以做很多事情 , 就跟别人聊天聊天聊天的时候就跟我说你给它买一个买一束花 , 比如说 , 那么 AI 就腾讯的 AI 就可以知道它在哪里 , 然后把
它附近的那个什么送花的什么什么小程序打开来 , 然后把这个花买好 , 然后再点给送给它 。
对啊 , 这就是一个很好的惊喜 , 然后如果确实有用 , 那它就形成了一个闭环 。
是是是 , 我不知道对于苹果来说能做到这个事情会有多远 , 听上去好像比腾讯做到这个事情要远很多 。
这作为工程师 , 我觉得想要想这个还是比较困难的 ,但是你真的用到的时候 , 你就会觉得啊 , 真的是还是很有用的我们做的东西 。
总结1:10:17
OK, 今天聊了很多啊 , 那我总结一下, 就感觉这次的 WWDC 主要的内容一方面是 Liquid Glass 可能做了一些画面方面的升级吧 , 另外一方面一些做了一些 APP 优化的事情 , 还有就是作为有娃的家长来说 , 现在这个对于小孩的控制方面做得更加的强大和方便 , 然后关于 Apple Intelligence 的话 , 我觉得总结一下几点吧 , 一个是 Siri AI 终于变成了一个 APP, 就跟那个豆包或者是就跟 Claude ChatGPT 一样
, 然后另外的话 ,Apple 自己的那套自成体系的技术架构用了 Gemini 之后成为了一个新的东西 , 至于它的效果如何 , 就是有待大家具体的测评来看了 。
除此之外的话 , 就是各个相关的 APP, 包括 Messenger 啊 , 包括 Safari 啊 , 包括 Shortcuts 啊 , 包括 Photos 啊 , 都进行了一些大家其实不那么陌生的 AI 强化吧 , 然后另外就是一定的功能大家可以通过口嗨来进行客制化 , 比如说创建 Shortcuts, 包括说是让 browser 去做一些插件 , 这些都可以通过口嗨去自己去创造一点点小的东西啊 。
同时还有一个挺有意思的事情 , 就是聊了这么多时间的 Siri,但是专门放 Siri 的那个 HomePod 好像这次 WWDC 完全没有提到 ,Vision Pro 至少还有提到 ,HomePod 好像完全就没有提到 。
是啊 ,CarPlay 也没有提到啊 , 我其实我 CarPlay 使用频率很高 ,有时候收到短信 , 然后它回复它也很不智能 , 希望都会能有个一些改进 。
是是是 , 那差不多就是这样一些更新吧 , 那具体就期待它最后的正式发布会怎么样啊 ,是不是两年以后我们再次提到说这个 Siri 又出来 ,Siri AI 出了新的版本 , 它还是在尝试做同样的事情 , 那我们就不得而知了 , 希望它能够在这个版本就把它所承诺的事情做好吧 。
那也非常感谢各位听众来听我们的节目啊 , 这大家如果喜欢的话 , 欢迎在各大平台点赞转发 , 包括在留言区跟我们分享你觉得你期待的 AI 能够如何使得你的 iPhone iMac 变得更好用啊 , 那我们后会有期 , 下期再见 , 拜拜 。
拜拜
。
