谷歌发布「与书对话」检索引擎,从字里行间邂逅心仪书籍

今日,谷歌分享了 Semantic Experiences,在博客中展示了两大关于自然语言理解的互动工具。Talk to Books 是一个可以从书中的句子层面搜索书籍的全新检索模式;另一个互动内容则是 Semantris,一个由机器学习驱动的单词联想游戏。

地址:https://research.google.com/semanticexperiences/

谷歌还发布了「通用语句编码器」(Universal Sentence Encoder),更加详细地呈现了上述示例所使用的模型;当然,谷歌还为开源社区提供了一个预训练的 TensorFlow 模型,开发者可以测试自己的句子及短语编码。

地址:https://tfhub.dev/google/universal-sentence-encoder/1

自然语言理解在近年已经有了极大进步,这得益于词向量(word vectors)的发展,这一技术使算法能根据实际语言使用的例子来学习单词之间的关系。这些向量模型根据概念和语言的等价性、相似性或关联性,将语义相似的词或短语投影到临近点。

建模方法

谷歌拓展了在向量空间中表征语言(language)的构想,这一想法通过为像完整句子或段落为代表的较大语言块创建向量来实现。语言是由具有概念的层次结构组成的,因此团队采用模块的层次结构来构建向量,每一模块都要考虑与不同时间尺度序列所对应的特征。各种类型的关系,如关联、同/反义、部分/整体等都可以用向量空间语言表示。团队在论文《Efficient Natural Language Response for Smart Reply》有更多介绍。

论文地址:https://arxiv.org/abs/1803.11175

Talk to Books

谷歌发布「与书对话」检索引擎,从字里行间邂逅心仪书籍

以往我们在检索书籍时,通常会从书名、作者、主题等表面标签入手。而谷歌发布的「Talk to Books」可以为用户提供一种检索书籍的全新方法。用户只需要做一段相关描述,或是提一个相关的问题,那么 Talk to Books 可以在不依赖关键词匹配的情况下,从超过 10 万本书籍中检索所有句子,并根据句子层面的语义,找到能匹配用户陈述或问题的句子。从某种意义上来说,Talk to Books 是一种用户与书「交谈」的新模式,系统给出的回答也能帮助用户确定自己是否对相关主题感兴趣。

模型在正式发布前经历了超十亿次的对话训练,以打磨更好的用户体验——对用户的提问或陈述给出更加合适的回答。这一方式相比起普通的谷歌检索,可能会帮助用户找到一些更有趣的书籍,特别是在关键字搜索中并不会显示的一些结果。

不过,这一模型还有更多的改进空间,比如搜索范围局限在句子层面上,而不是段落,因此可能会产生「断章取义」的情况。另外,因为只看某一句子的匹配程度,这也可能导致某些众所周知的、「符合口味」的书并不会出现在检索结果的前列。谷歌团队此举,更多的是希望帮助人们以一种新的探索方式,发现不曾料想过的作者和书名,竟然会有读者感兴趣的内容。

地址:https://books.google.com/talktobooks

Semantris

谷歌发布「与书对话」检索引擎,从字里行间邂逅心仪书籍

Semantris 是一个由相同技术驱动的单词联想游戏。屏幕上会呈现所有单词,用户可以输入某个单词,随即系统会根据屏幕上单词与用户输入单词的关联程度进行重新排序。不论是近义词、反义词还是相近概念,系统都能找到对应的排序模式。

如图所示,用户输入「Photo」时,最顶部的「Camara」因为与输入单词的关联最为紧密,因此会更替排序调整到第一位「消掉」。这确实是一个锻炼联想能力的好机会,此外还有限时模式和不限时模式供用户体验。

地址:https://research.google.com/semantris

相信在这两个工具的驱动下,人工智能能够与用户更好地进行交互学习,并且帮助人类在现实生活中更好地理解科技,使用科技,并受惠于科技。

中国联通正在关闭 2G 网络

从 4 月 12 日起,一则关于中国联通开始关闭 2G 网络的消息在网上流传,该消息还宣称将会有大量的联通 2G 用户将因此受到影响,造成了部分用户的恐慌。

不过实际上,这种恐慌大可不必存在。

联通 2G 用户不必恐慌

对此,中国联通于 4 月 13 日在官方微博上回应称,中国联通的确正在有序推进 2G 网络减频工作,其主要方式是推动 2G 客户向 4G 网络进行消费升级。

中国联通确认正在关闭 2G 网络,但其实 2G 用户完全不必恐慌

针对 2G 用户所担忧的问题,中国联通表示,将采取免费更换手机卡、赠送体验流量、优惠购机等多种优惠措施,协助现有 2G 客户升级为 4G 网络;在此过程中,现有 2G 客户服务不受任何影响。换句话说,即使是没有升级意愿的联通 2G 用户,也完全不必担心联通的这一动向所带来的影响。

雷锋网(公众号:雷锋网)了解到,截至 2017 年底,中国联通拥有约 2.84 亿用户,其中 4G 用户数约为 1.75 亿,占比 61.62%;而 2G 客户占比约为客户总数的 2%,超过 500 万户。从现有的用户分布来看,整体联通用户群体的用网情况极不均衡,但 4G 已经占据主体地位,而 2G 则变得越来越少了。

中国联通在回应中表示,2G 网络减频措施的推出,是基于 4G 移动网络已经全面普及、5G 即将到来的大背景,并表示这是淘汰通信业落后产能的实际行动,有助于移动通信网络的“去库存”与转型升级,有助于进一步提升联通服务能力质量与水平、持续提升消费者的获得感。

关于清退 2G 网络的说法,早在 2016 年就有所发酵,然而实质性的行动并不多。不过,随着 5G 的到来愈加临近,如何处理 2G 网络成为一个被提上日程的问题。有消息称,早在 2018 年 1 月底中国联通就已经在多省市开始积极部署 2G 网络的退服工作,并要求市场线严禁发展 2G 业务。

中国联通确认正在关闭 2G 网络,但其实 2G 用户完全不必恐慌

即使如此,中国联通也不大可能采取一刀切的方式短时间彻底关闭 2G 网络,反而更可能采取鼓励升级之类的温和性做法;毕竟作为一家需要承担普及网络通信的社会责任的央企,它无法对 500 多万用户的需求漠然视之。

关闭 2G 网络是大势所趋

虽然当下 2G 仍然有它继续存在的必要性,但从长远来看,关闭 2G 是大势所趋,无可避免的。

对于中国联通来说,目前部署 2G 网络的 900Mhz、1800Mhz 为优质的频段,也是中国联通继续发展其他网络急需的资源。早在去年,工信部就已经发文,允许运营商在 GSM 频段上部署 NB-IoT 系统,而中国移动随之也在原有 2G 频段上建设基于 4G 的 NB-IoT 网络,同理联通也需要这部分资源。

另外,从运营商维护的角度,用户人数越来越少的 2G 网络在维护上也需要大量的成本;一旦关闭,这部分成本可以省下来。

放眼全球,已经有多个国家的运营商正式关闭了 2G 网络,雷锋网在此列举如下:

  • 2017 年 1 月,美国 AT&T、加拿大 Bell、Telus 等运营商纷纷关停 2G 网络;
  • 2017 年 4月,M1、Singtel、StarHub 三家新加坡运营商关闭 2G 网络,同月,澳大利亚第二大电信运营商 Optus 也关闭了 2G 网络;
  • 2017 年 7 月底,加拿大另一家运营商 SaskTel 也宣布关闭 2G 网络;
  • 2017 年 9 月底,澳大利亚沃达丰关闭 2G 网络。

这些运营商之所以能够关闭 2G 网络,一方面在于移动通信技术的发展已经进入到 5G,另外一方面则是基于它们的商业化需求。尤其是在全球 5G 发展已经进入到标准制定和前期部署阶段的情况下,2G 网络存在的意义的确比削弱了很多。

值得一提的是,经历了 2G 跟随、3G 追赶、4G 并驾齐驱的发展节奏之后,我国在 5G 方面的发展已经步入引领者的角色。目前三大运营商都已经明确了 5G 发展路线的时间表,并已经在相关城市开展 5G 网络的试验部署工作;由此可以理解为什么网上【 关闭 2G 网络】的声音越来越大了。

中国联通确认正在关闭 2G 网络,但其实 2G 用户完全不必恐慌

不过对于中国三大运营商来说,彻底关闭 2G 并非是一件容易事。截至 2017 年底,我国仍有 157 万个 2G 基站、2.9 亿的 2G 用户,以及较为依赖 2G 网络的海量物联网设备;如此庞大的应用体量,也势必会让 2G 网络的清退成为一项长期工程。

毕竟,从某种意义上说,我国的 2G 网络问题已经不仅仅是一个商业问题,也更是一个民生问题了。

美国签证新规:需要交出QQ、微博聊天记录

据新华社报道:美国国务院3月30日公布文件,拟要求美国签证申请者提交社交媒体用户名等多项个人信息,引起了大家的广泛关注。

据国务院发布的文件显示:新规定要求签证申请者提供过去5年在指定社交媒体平台上的个人信息;申请者也可以自行选择提供非指定社交媒体平台上的个人信息。

据美国《纽约时报》报道,新规定针对的指定社交媒体平台有20家。其中大部分设在美国,包括脸书、推特、领英等;俄罗斯社交媒体平台VK、比利时交友平台Twoo和拉脱维亚社交问答平台Ask.fm;被列入的国内社交平台为:豆瓣、QQ、新浪微博、腾讯微博。

签证申请者还被要求提供过去5年曾使用的电话号码、电子邮箱地址、国际旅行记录以及是否曾违反移民法、是否曾被驱逐出境、是否有家庭成员参与恐怖主义活动等信息。

此前美国只要求需要接受额外审查的签证申请者提供社交媒体、电子邮件和电话号码等信息。

据美国国务院估计,将有71万移民签证申请者和1400万非移民签证申请者受到新规定的影响。外交、公务等特定类型签证申请者不受新规影响。

已有知情者发出提醒:对于华人而言,有些字可能是你在海外咨询服务时用过的,或者是在聊天时涉及的,但是如果准备申请美国签证,在提交社交媒体账号之前,一定不能出现,如果有,一定要提前删除。

[danger]  B2签证

安全词:旅游、看朋友家人、看演唱会、出席活动、参加会议

危险词:学英语、上课、月子中心、美国生孩子、办绿卡拿身份、代购生意、发货、美国买房、办身份、枪支、来美找工作、袭击、爆炸

绿卡

安全词:永居、留美、移民美国目的(为了工作、家人团聚等等)

危险词:酒驾、之前犯罪记录、过短的留美时间、白卡Medical等福利信息、来移民的、要帮家人亲戚移民

F签证

安全词:上课、学习、专业、学校、职业规划

危险词:代购、代课、代考、兼职、移民、美国买房、找工作、庇护、办身份、枪支

H1B签证

安全词:工作经历、职位、薪资(要与职位相符)、职业规划

危险词:申请作假、跳槽、公司裁员、转换身份[/danger]

腾讯QQ国际版关闭欧洲服务

QQ向国际版用户发来通知,称其因运营需要,自5月20日起将不再为欧洲用户提供服务。这可能与欧盟即将于5月25日推行的新规有关:任何收集欧盟公民个人资料的公司都需要在用户知情并同意的情况下展开工作,否则将被处以全球营业额的4%或2000万美元甚至更高的罚款。

新浪微博宣布封杀腐基耽美类内容

正在进行自我审查或清理整顿的新浪微博宣布清理部分内容,其中一个主要清理对象是同性恋内容。同性恋在中国并不是非法,但政府在进行内容监管的时候经常会将同性恋内容列入其中。

新浪微博官方账号称:为了进一步营造晴朗和谐的社区环境,微博根据《网络安全法》等法律法规的要求,严格履行企业主体责任,现开展为期三个月的针对违规漫画、游戏及相关图文短视频内容的集中清理行动。本次行动主要的清查对象包括:

1、涉黄的、宣扬血腥暴力、同性恋题材的漫画及图文短视频内容,如包含以下特征的内容:“腐、基、耽美、本子”;2、含有暴力内容的违法游戏(如:侠盗飞车、黑手党、雇佣兵)及相关的动图短视频内容…其中腐、基、耽美都是指

同性恋,而本子则是指同人漫画。

Google 停售 Pixel 和 Pixel XL 手机

Google 在 2016 年发布的旗舰手机 Pixel 和 Pixel XL 已经从官方商店移除,这意味着 Google 的库存已经耗尽,不会再补货了。Google 的旗舰手机过去几年开始采用类似苹果的定价策略,不再亲民,而是面向利润率更高的高端市场。

此外一代的 Pixel 手机还一直面临库存不足的问题,这些问题加上狭窄的分销网络,使得有 Google 名字加持的智能手机销量并不高,根据 IDC 的数据,Google 在 2017 年只售出了 390 万部手机。去年 10 月发布的 Pixel 2 和 2 XL 的库存状况则有了明显改善。

关于平台短视频的一点个人看法

短视频平台

2018年,CCTV指责某视频软件宣传未成年人怀孕以后,中国最热门的两个视频平台在应用商店中消失了。随着政府对互联网的监管扩大,不仅被政府认定的颠覆性言论内容,不健康的或者色情的内容也被归入其中。
昨天的各大APP也被下架处理,由此可见,政府在严打视频应用,我觉得那些低俗的视频应用就应该被严打,不仅如此,还要使劲罚!
就拿某手来讲,未成年人怀孕,破坏的不仅仅是互联网的风气,更是一个家庭,他们的身心和价值观!风波虽然终究会被时间磨灭,但是对这些未步入社会的少女来讲,将会是永远的痛!某手的领导层,你们就是畜生!

网络短视频会成为中国科技公司的新战场!恶意的导流,引导用户观看的时代已经成为历史!这将是中国网络短视频发展的转折点!

让我们静静等待!时间会给我们一个答案!

继续阅读关于平台短视频的一点个人看法

模板对wordpress的速度影响

这个我想我真的不需要多讲,有一些wordpress的模板是海外的,也就是老外用的模板,这些模板讲真,国内真的不能拿来直接用,因为比如说有些字体,国内都不能用,就这一条,就能把你服务器内存飚到60%或者更多!

影响速度的原因很多,这只是其中一方面,也是非常重要的一方面,还有什么插件啊!什么的!

对于wordpress的各项优化,建议大家访问这个网站进行了解

传送门:人人都能学会的wordpress实战课