以图搜图:找到相似图片的技术原理

识别图片的技术原理是什么?计算机怎么知道两张图片相似呢?

其实原理非常简单易懂,我们可以用一个快速算法,就达到基本的效果。

以图搜图:找到相似图片的技术原理插图

这个关键技术叫做”感知哈希算法”(Perceptual hash algorithm),它的作用是对每张图片生成一个”指纹”(fingerprint)字符串,然后比较不同图片的指纹。结果越接近,就说明图片越相似。

下面是一个最简单的实现流程:

第一步,缩小尺寸。

将图片缩小到8×8的尺寸,总共64个像素。这一步的作用是去除图片的细节,只保留结构、明暗等基本信息,摒弃不同尺寸、比例带来的图片差异。

第二步,简化色彩。

将缩小后的图片,转为64级灰度。也就是说,所有像素点总共只有64种颜色。

第三步,计算平均值。

计算所有64个像素的灰度平均值。

第四步,比较像素的灰度。

将每个像素的灰度,与平均值进行比较。大于或等于平均值,记为1;小于平均值,记为0。

第五步,计算哈希值。

将上一步的比较结果,组合在一起,就构成了一个64位的整数,这就是这张图片的指纹。组合的次序并不重要,只要保证所有图片都采用同样次序就行了。

得到指纹以后,就可以对比不同的图片,看看64位中有多少位是不一样的。在理论上,这等同于计算”汉明距离”(Hamming distance)。如果不相同的数据位不超过5,就说明两张图片很相似;如果大于10,就说明这是两张不同的图片。

继续阅读

“痛中之痛”的关键核心技术如何突破?

“痛中之痛”关键核心技术的突破往往并非依赖于某一项单点技术是否先进,而是取决于其所在相应技术体系和产业基础能力要素的持续优化和整合能力。为此,应重视创新突破过程中相关要素的整体性、结构性和有机关联性。

“痛中之痛”的关键核心技术如何突破?插图

为完成“十四五”规划和二〇三五年远景目标,落实新发展理念,推动高质量发展,构建新发展格局,实现科技自立自强,首先要突破集成电路前沿工艺、基础软件系统、高端芯片设计、高精尖制造设备和产业级基础材料等为代表的“痛中之痛”关键核心技术,它们是支撑各类产业可持续发展的基石,长期以来困扰我国经济社会发展和产业链安全。

认清“痛中之痛”关键核心技术特点

“痛中之痛”关键核心技术的突破有赖于深刻把握其创新规律。与一般性的产业技术相比,这些“痛中之痛”关键核心技术具有超高密度科技要素聚集的特点。

首先,“痛中之痛”关键核心技术投入强度较大、技术壁垒极高、研发周期较长。

例如,一条集成电路先进生产线的设备投入可以达到百亿美元以上;一种新型光刻机的研发周期往往达到 15年以上,汇聚全球上万的工程科技人员联合攻关;而一种工业级基础材料的工艺研制,往往要进行上千种不同配比的测试对比。

继续阅读

一种不可抗拒的自然规律:衰老

衰老是不可避免的生命阶段,衰老还是一道生命的长坡。

一种不可抗拒的自然规律:衰老插图

第七次全国人口普查数据显示,目前我国60岁以上人口已达2.6亿人,占总人口比例达18.70%。老龄化进程的加深给家庭和社会带来很多新的挑战。

我们该怎么看待衰老之人必将面对的疾病和死亡问题,怎么有尊严地度过生命的最后阶段?

大家常说“爱情是永恒的主题”,其实死亡更是一个“永恒的主题”。

之所以“永恒”,一是因为它的“无解”,没有人真正有过“死”的体验。二是因为它重要,不解决对死亡的认识问题,就会让人始终活在对死亡的恐惧中,而临到死时会痛苦万分。

从社会层面上看,对死亡的恐惧还是造成过度医疗和临终阶段过度抢救的重要源头。

与死亡一样,衰老也是一种必然,而且是一道生命长坡。除去各种原因引起早死的人,一般人都会经由衰老而至死亡。

衰老是死亡的前奏。

什么是衰老呢?

世界卫生组织的定义是:衰老是体内各种分子和细胞损伤随时间逐步积累的过程。

继续阅读

站点索引量(Site Index)

什么是站点索引量?

站点中有多少页面可以作为搜索候选结果,就是一个网站的索引量。

站点索引量(Site Index)插图

站点内容页面需要经过搜索引擎的抓取和层层筛选后,方可在搜索结果中展现给用户。页面通过系统筛选,并被作为搜索候选结果的过程,即为建立索引。这能影响到网站收录率,是一个非常重要的seo因素。

目前site语法的数值是索引量估算值,比较不准。

7个提高站点索引量的方法:

一、网站内容

百度蜘蛛喜欢文字性的内容且喜欢原创。

当蜘蛛爬行到我们的网站上时,如果发现文字内容和其他网站上的内容一样或者没有新意,这样百度蜘蛛怎么能再次到访和提高拜访的频率呢!

所以,做好网站内容成为了关键,只有好的内容才可以吸引读者,吸引百度蜘蛛,内容是一切的源泉,只有把内容写好才会有好的收录,要想收录就要写符合搜索引挚和用户的文章内容,独一无二的精彩文章,必须是原创,这样蜘蛛才有兴趣继续爬想下去.所以最好用文字来表达。

此外,一个网站的文章我们还要注意原创和伪原创的合理分配,一个网站伪原创的文章最好不要超过30%。要想提高访问频率就得多写原创文章。

如果你看到一个网站没有排名了,这就说明百度蜘蛛已经不来抓取你网站的内容,而造成的现象就是网站索引量归零。而解决这一现象的措施就是全面提高文章质量,只要文章质量高了,那么网站索引量也就相应的提高了。

继续阅读

广州塔/小蛮腰(Canton Tower)

广州塔(Canton Tower)又称广州新电视塔,昵称小蛮腰。

广州塔/小蛮腰(Canton Tower)插图

广州塔塔身主体高454米,天线桅杆高146米,总高度600米,是世界上最高的广播电视观光塔。国家AAAA级旅游景区。

英文名为“Canton Tower”。英文名不用“Guangzhou Tower”是因为“GuangZhou”这个名称在西文语境中比较陌生,发音也比较别扭。更为重要的是,在中国对外开放通商历史中,作为海上丝绸之路的起源和起点,广州被世人所认识的英文名称一直是“Canton”。

“Canton”既指广州,也指广东,广东话、广州人。

继续阅读

“小国”新加坡,强悍的制造业!

你对新加坡的印象是什么?

华人多?发达国家?花园城市?国土面积小?亚洲四小龙?亚太地区的金融中心?全球最繁忙的货运海港?

“小国”新加坡,强悍的制造业!插图

都没错。可这些光鲜亮丽的标签背后,我们很容易忽视的是它强悍的制造业。

新加坡国土面积很小,只有720平方公里左右。720平方公里是什么概念呢?只占整个北京市行政区划的4.38%,跟整个北京的中心城区面积差不多(五环内约660平方公里)。

虽然新加坡确实很小,但它的制造业相当发达。

制造业占GDP的比重高

2020年,新加坡制造业对GDP的贡献约为1060亿新元,约占21%,是世界上为数不多的制造业占比超过GDP20%的国家。

我们印象中的科技制造强国,如德国、日本,其制造业占GDP的比重平均也就维持在20%左右。而其他发达国家,如美国、法国,仅为10%,老牌工业强国英国,2019年只有8.59%。

继续阅读

茼蒿花

茼蒿这种菜,很多人都吃过,可是茼蒿花,却未必有许多人认识吧。

茼蒿是菊科春黄菊族植物,它的花朵自然形似菊花,花瓣为黄色或白色,花色亮丽,有菊花的香气。

茼蒿花的花语是丰富、多才多艺。

茼蒿花插图

继续阅读

时间是什么?是否存在?

天地灵幻,心物一体。因时而存,以时为序。存分虚实,序有前后。心物二元,时间二象。

时间是什么?是否存在?插图

注释:

天地是灵的幻变,心和物本是一体的。

唯心世界基于“时间”而存在(心造宇宙以时间为起始),唯物世界以“时间”为顺序(唯物世界沿着时间的方向演化)。

存在分为虚实形态(比如虚态角度时间无形无态,实态角度时间通过事物变化体现),顺序分为前后方向(比如时间从过去驶向未来)。

自然世界是心物二元的构成,从唯物和唯心不同角度时间具有两种解释。

——

在我们认知中,“年月日”是时间的象征。

年是指地球绕太阳公转一周的时间,月是指月球围绕地球公转一周的时间,日是指地球自转一周的时间。

时间究竟是什么?到底存不存在?

继续阅读

自我认知

自我认知(self-cognition)指的是对自己的洞察和理解,包括自我观察和自我评价。

自我观察是指对自己的感知、思维和意向等方面的觉察;自我评价是指对自己的想法、期望、行为及人格特征的判断与评估,这是自我调节的重要条件。

自我认知插图

自我认知也叫自我意识,或叫自我,是个体对自己存在的觉察,包括对自己的行为和心理状态的认知。

现在,给你5分钟,做个自我介绍……

卡壳。

现在,能告诉我你最喜欢做的事情吗?能告诉我你觉得自己有什么优点和缺点吗?

继续卡壳……

你觉得不觉得,如果让你描述你身边的某个朋友,你很容易描述出来,高矮胖瘦,喜欢吃土豆,爱睡懒觉,口头禅是什么什么,猥琐男……

可是,试着用50个字,描述一下自己……,还是卡壳。

让我10天不照镜子,我会发现我不知道自己长什么样。

如果给我一面美化过的镜子,天天照,结果我就非常自我感觉良好,整个人也就神采飞扬。

人,最难认识的,也许就是自我。

所以,很多人会做很多测试帮助认识自我,会看很多星座描述,帮助定位自我,结果又会被测试结果牵引,照着心理暗示去成为自己应该成为的人。

继续阅读

下一次疫情,会是什么病毒作祟?

据估计,动物身上有多达80万种可能感染人类的病毒。虽然识别它们是一项极其复杂的任务,但我们还是大致知道该去关注哪些病毒。

下一次疫情,会是什么病毒作祟?插图

美国约翰·霍普金斯健康安全中心发表了一份对全球120多名传染病专家的采访。他们一致认为,全球疫情最有可能由一种从动物传播过来的新病毒引发。“新”意味着我们对它没有免疫力。他们还认为,它会通过咳嗽和打喷嚏在人与人之间传播,并且它还可能通过无症状感染者传播。

这一切听起来很熟悉,是不是?没错,这次新冠疫情完全证实了他们的预言。

根据病毒体内的遗传物质,病毒可分为DNA病毒和RNA病毒。专家们认为,RNA病毒(冠状病毒就属于RNA病毒)比DNA病毒风险更大。因为DNA病毒更稳定,通常不太可能变异成致命的毒株——不过有一个例外,人类历史上肆虐了2000多年的天花,就是DNA病毒。

在已知的168个病毒家族中,专家们认为,我们应该密切关注其中的5个,它们可能会成为下次疫情的主角。

——

01:冠状病毒

冠状病毒在系统分类上属套式病毒目(Nidovirales)冠状病毒科(Coronaviridae)冠状病毒属(Coronavirus)。冠状病毒属的病毒是具囊膜(envelope)、基因组为线性单股正链的RNA病毒,是自然界广泛存在的一大类病毒。

冠状病毒直径约80~120nm,基因组5′端具有甲基化的帽状结构,3′端具有poly(A)尾,基因组全长约27-32kb,是目前已知RNA病毒中基因组最大的病毒。

冠状病毒仅感染脊椎动物,如人、鼠、猪、猫、犬、狼、鸡、牛、禽类。

冠状病毒最先是1937年从鸡身上分离出来,病毒颗粒的直径60~200nm,平均直径为100nm,呈球形或椭圆形,具有多形性。病毒有包膜,包膜上存在棘突,整个病毒像日冕,不同的冠状病毒的棘突有明显的差异。在冠状病毒感染细胞内有时可以见到管状的包涵体。

2019新型冠状病毒(2019-nCoV,引发新型冠状病毒肺炎COVID-19)是目前已知的第7种可以感染人的冠状病毒,其余6种分别是HCoV-229E、HCoV-OC43、HCoV-NL63、HCoV-HKU1、SARS-CoV(引发重症急性呼吸综合征)和MERS-CoV(引发中东呼吸综合征) 。

继续阅读