12 月 3 日消息,据外媒 PC mag 报道,谷歌悄然为 Gmail 新增了一个垃圾邮件过滤器,号称在识别垃圾邮件、网络钓鱼邮件方面拥有更好表现。
据介绍,这个新的垃圾邮件过滤器是基于 Google Colab 上的新型开源多语言文本矢量化器 RETVec (弹性高效文本矢量器)。它可以将单词映射成矢量或者数字,从而被用来提升垃圾邮件和钓鱼邮件的识别率,同时降低误报率。
由于网络犯罪分子仍然持续创建绕过防御系统的内容,导致当前文本分类模型在识别诈骗和网络钓鱼攻击方面仍存在困难。谷歌方面声称,RETVec 在经过训练之后,能够检测并理解“字符级”的操作,包括插入、删除、拼写错误、同音字,同时还能降低计算成本。
根据谷歌自己的统计,将 RETVec 应用到 Gmail 后,垃圾邮件检测率相比以往的过滤器提高 38%、误报率降低 19.4%、张量处理单元 (TPU) 使用率降低了 83.13%。
谷歌方面声称,使用 RETVec 训练的模型表现出更快的推理速度,较小的模型可以降低计算成本并减少延迟,这对于大规模系统和设备上的模型至关重要。