沐鸣2注册地址_干货 | AR增强现实技术全解读

用户对现实世界感知的新技术。一般认为,AR技术的出现源于虚拟现实技术(Virtual Reality,简称VR)的发展,但二者存在明显的差别。传统VR技术给予用户一种在虚拟世界中完全沉浸的效果,是另外创造一个世界;而AR技术则把计算机带入到用户的真实世界中,通过听、看、摸、闻虚拟信息,来增强对现实世界的感知,实现了从“人去适应机器”到技术“以人为本”的转变。

AR技术原理
AR从其技术手段和表现形式上,可以明确分为大约两类,一是Vision based AR,即基于计算机视觉的AR,二是LBS basedAR,即基于地理位置信息的AR。

Vision based AR

基于计算机视觉的AR是利用计算机视觉方法建立现实世界与屏幕之间的映射关系,使我们想要绘制的图形或是3D模型可以如同依附在现实物体上一般展现在屏幕上,如何做到这一点呢?本质上来讲就是要找到现实场景中的一个依附平面,然后再将这个3维场景下的平面映射到我们2维屏幕上,然后再在这个平面上绘制你想要展现的图形,从技术实现手段上可以分为2类:

1、 Marker-Based AR

这种实现方法需要一个事先制作好的Marker(例如:绘制着一定规格形状的模板卡片或者二维码),然后把Marker放到现实中的一个位置上,相当于确定了一个现实场景中的平面,然后通过摄像头对Marker进行识别和姿态评估(Pose Estimation),并确定其位置,然后将该Marker中心为原点的坐标系称为Marker Coordinates即模板坐标系,我们要做的事情实际上是要得到一个变换从而使模板坐标系和屏幕坐标系建立映射关系,这样我们根据这个变换在屏幕上画出的图形就可以达到该图形依附在Marker上的效果,理解其原理需要一点3D射影几何的知识,从模板坐标系变换到真实的屏幕坐标系需要先旋转平移到摄像机坐标系(Camera Coordinates)然后再从摄像机坐标系映射到屏幕坐标系。

在实际的编码中,所有这些变换都是一个矩阵,在线性代数中矩阵代表一个变换,对坐标进行矩阵左乘便是一个线性变换(对于平移这种非线性变换,可以采用齐次坐标来进行矩阵运算)。公式如下:

矩阵C的学名叫摄像机内参矩阵,矩阵Tm叫摄像机外参矩阵,其中内参矩阵是需要事先进行摄像机标定得到的,而外参矩阵是未知的,需要我们根据屏幕坐标(xc ,yc)和事先定义好的Marker 坐标系以及内参矩阵来估计Tm,然后绘制图形的时候根据Tm来绘制(初始估计的Tm不够精确,还需要使用非线性最小二乘进行迭代寻优),比如使用OpenGL绘制的时候就要在GL_MODELVIEW的模式下加载Tm矩阵来进行图形显示。

2、 Marker-Less AR

基本原理与Marker based AR相同,不过它可以用任何具有足够特征点的物体(例如:书的封面)作为平面基准,而不需要事先制作特殊的模板,摆脱了模板对AR应用的束缚。它的原理是通过一系列算法(如:SURF,ORB,FERN等)对模板物体提取特征点,并记录或者学习这些特征点。当摄像头扫描周围场景,会提取周围场景的特征点并与记录的模板物体的特征点进行比对,如果扫描到的特征点和模板特征点匹配数量超过阈值,则认为扫描到该模板,然后根据对应的特征点坐标估计Tm矩阵,之后再根据Tm进行图形绘制(方法与Marker-Based AR类似)。

LBS-Based AR

其基本原理是通过GPS获取用户的地理位置,然后从某些数据源(比如wiki,google)等处获取该位置附近物体(如周围的餐馆,银行,学校等)的POI信息,再通过移动设备的电子指南针和加速度传感器获取用户手持设备的方向和倾斜角度,通过这些信息建立目标物体在现实场景中的平面基准(相当于marker),之后坐标变换显示等的原理与Marker-Based AR类似。

这种AR技术利用设备的GPS功能及传感器来实现,摆脱了应用对Marker的依赖,用户体验方面要比Marker-Based AR更好,而且由于不用实时识别Marker姿态和计算特征点,性能方面也好于Marker-Based AR和Marker-Less AR,因此对比Marker-Based AR和Marker-Less AR,LBS-Based AR可以更好的应用到移动设备上。

AR增强现实系统组成

Monitor-based系统

在基于计算机显示器的AR实现方案中,摄像机摄取的真实世界图像输入到计算机中,与计算机图形系统产生的虚拟景象合成,并输出到屏幕显示器,用户从屏幕上看到最终的增强场景图片。它虽然不能带给用户多少沉浸感,但却是一套最简单使用的AR实现方案。由于这套方案的硬件要求很低,因此被实验室中的AR系统研究者们大量采用。

Video see-through系统

头盔式显示器(Head-mounted displays-HMD)被广泛应用于虚拟现实系统中,用以增强用户的视觉沉浸感。增强现实技术的研究者们也采用了类似的显示技术,这就是在AR中广泛应用的穿透式HMD。根据具体实现原理又划分为两大类,分别是基于视频合成技术的穿透式HMD(video see-through HMD)和基于光学原理的穿透式HMD(optical see-through HMD)。

图表 Video see-through增强现实系统实现方案

Optical see-through系统

在上述的两套系统实现方案中,输入计算机中的有两个通道的信息,一个是计算机产生的虚拟信息通道,一个是来自于摄像机的真实场景通道。而在optical see-through HMD实现方案中去处了后者,真实场景的图像经过一定的减光处理后,直接进入人眼,虚拟通道的信息经投影反射后再进入人眼,两者以光学的方法进行合成。

三种系统结构的性能比较

三种AR显示技术实现策略在性能上各有利弊。在基于monitor-based和video see-through显示技术的AR实现中,都通过摄像机来获取真实场景的图像,在计算机中完成虚实图像的结合并输出。整个过程不可避免的存在一定的系统延迟,这是动态AR应用中虚实注册错误的一个主要产生原因。但这时由于用户的视觉完全在计算机的控制之下,这种系统延迟可以通过计算机内部虚实两个通道的协调配合来进行补偿。而基于optical see-through显示技术的AR实现中,真实场景的视频图像传送是实时的,不受计算机控制,因此不可能用控制视频显示速率的办法来补偿系统延迟。

另外,在基于monitor-based和video See-through显示技术的AR实现中,可以利用计算机分析输入的视频图像,从真实场景的图像信息中抽取跟踪信息(基准点或图像特征),从而辅助动态AR中虚实景象的注册过程。而基于optical see-through显示技术的AR实现中,可以用来辅助虚实注册的信息只有头盔上位置传感器。

AR增强现实的技术支撑

识别与跟踪技术

在实现增强现实的过程中,需要对真实的场景和信息进行分析,生成虚拟事物信息。这两步看似简单,其实在实际进行过程中,需要将摄像机获得的真实场景的视频流,转化成数字图像,然后通过图像处理技术,辨识出预先设置的标志物。

识别出标志物之后,一标志物作为参考,结合定位技术,由增强现实程序确定需要添加的三维虚拟物体在增强现实环境中的位置和方向,并确定数字模板的方向。将标志物中的标识符号与预先设定的数字模板镜像匹配,确定需要添加的三维虚拟物体的基本信息。生成虚拟物体,并用程序根据标识物体位置,将虚拟物体放置在正确的位置上。这其中涉及到的识别跟踪和定位问题,是增强现实的最大的难题之一。

要实现虚拟和现实事物的完美结合,必须确定虚拟物体在现实环境中准确的位置,准确的方向,否则增强现实的效果就会大打折扣。而在现实环境中,由于现实环境的不完美性,或者称为复杂性,增强现实系统在这种环境下的效果远不如在实验室的理想环境中。由于现实环境中的遮挡,未聚焦,光照不均匀,物体运动速度过快等问题,对增强现实的跟踪定位系统提出了挑战。

如果不考虑与增强现实进行交互的设备,其主要实现跟踪定位的方法有如下两种:

图像检测法

使用模式识别技术(包括模板匹配,边缘检测等方法),识别获得的数字图像中预先设置的标志物,或是基准点,轮廓,然后根据其偏移距离和偏转角度计算转化矩阵确定虚拟物体的位置和方向。

这种方法进行跟踪定位不需要其他的设备,而且精确度较高,因此是增强现实技术中最常见的定位方法。在模板匹配时,系统会预先存储好多种模板,来和图像中检测到的标志物匹配来计算定位。简单的模板匹配可以提高图像检测的效率,因也为增强现实的实时性提供了保障。通过计算图像中标志物的偏移和偏转,也能够做到三维虚拟物体的全方位观察。模板匹配一般用于对应特定图片三维成像,设备通过扫描特定的图片,将这些图片中的特殊标志位与预先存储的模板匹配,即可呈现三维虚拟模型。比如汽车店的车模卡片,玩具公司的人物卡片,都可以用模板匹配来进行增强现实。边缘检测可以检测出人体的一些部位,同时也可以跟踪这些部位的运动,将其与虚拟物体物体无缝融合。比如,真实的手提起虚拟的物体,摄像机可以通过跟踪用户手的轮廓,运动方式来调整虚拟物体的方位。因此,许多商场的虚拟商品实用,多会使用边缘检测。

虽然图形检测法简单高效,但也有其不足的地方。图像检测发多用于相对理想的环境以及近距离的环境,这样获得的视频流和图像信息会清晰,易于进行定位计算。而如果在室外环境中,光线的明暗,物体的遮挡,以及聚焦问题,使得增强现实系统不能很好的识别出图像中的标志物,或是出现和标志物相似的图像,这样都会影响增强现实的效果。而此时,就需要其他跟踪定位方法的辅助。

全球卫星定位系统法

这种方法是基于详细的GPS信息进行跟踪和确定用户的地理位置信息。当用户在真是环境中行走时,可以利用这些定位信息和用户摄像机的方向失误,增强现实系统能将虚拟信息和虚拟物体精确的低价到环境景物以及周围的人物之上。目前由于智能设备的普及,智能手机的广泛应用,而又由于智能手机具有支持基于GPS定位法的增强现实系统的基本组件:摄像机,显示屏,GPS功能,信息处理器,数字罗盘等,并把它们集成为一体,因此这种跟踪定位法多用于这种智能移动设备上。一种称为增强现实浏览器的应用程序,主要就是应用这种方法。增强现实浏览器能够在智能手机上运行,它可以连接互联网,搜索相关的信息,然后让用户在真实的环境看到相关的信息。增强现实浏览器能够可以让用户了解到摄像机方向的几乎所有事物的信息,比如找到一家距离很近但是被遮挡住的餐厅,或是获取用户对一家咖啡馆的评价。

这种定位方式适合于室外的跟踪定位,可以克服在室外环境中,光照,聚焦等不确定因素对图像检测法造成的影响。

其实在增强现实系统实际运用的环境中,往往不会用单一的定位方法来定向定位。比如增强现实浏览器也会运用图像检测法来检测一些特定的符号,例如QR码。识别出QR码在进行模板匹配,即可为用户提供信息。

现实技术

当前的增强现实主要有如下三种显示技术:1、移动手持显示。2、视频空间显示和空间增强显示。3、可穿戴式显示。

智能手机通过相应的软件实时取景并显示叠加的数字图像,这就是移动手持式显示器的一般工作情况。同时现在平板电脑不断增加功能以及比智能手机更大的屏幕,也是的其日益流行。

手持增强现实标志物,通过网络摄像机在食品窗口或是显示器上显示虚拟叠加的图像,就是视频空间显示方式。带有增强现实功能的贺卡,既是用这种方式显示的。用户在收到贺卡后,登录相应的网站系统,用网络摄像机对准贺卡,用户即可从显示屏上得到贺卡内所存储的信息形成的虚拟物体和视频。而空间增强显示技术,则是利用把包括全息投影在内的视频投影技术,直接将虚拟数字信息显示在真实的环境之中。这种技术的系统不同于一般的增强现实系统,只适合于个人使用,而是能想增强现实与周围环境相结合,不仅仅限于单个用户。这种技术适用于大学或者图书馆,可以同时为一群人提供增强现实信息。也可以将控制组件投影到相应的实体模型上,方便工程师的交互操作。

可穿戴式显示器是一种可以戴在用户头上的类似眼镜的头盔显示器。我们熟知且期待的google glass正式这一类型的。可穿戴式显示器一般有一道两个内嵌镜头和半透明镜的小型显示器,在飞行仿真,工程设计以及教育训练等多个领域都有广泛的运用。头戴式设备可以让用户更加自然地体验增强现实,并且能够为用户提供更大的视场,给予用户更强,更真实的“身在该处”的感觉。

交互技术

最基础的增强现实人机交互就是用户查看虚拟数据。除此之外,还有一下一些交互技术

触觉接口交互

通过数字信息提供身体触感来进一步实现虚实结合。比如,可触碰的虚拟光球,可以在虚拟的碗上绘画的幻影笔。

协作式接口交互

使用多个显示器来支持远程共享与交互或是同地协作活动。这种交互能够与多种应用软件集成,可用于医学领域的执行诊断和外科手术,或是设备维修等。

混合接口交互

组合多种不同但是功能互补的接口,使得用户能够通过多种方式的增强现实的内容进行交互。这种交互使得增强现实的交互更加灵活,可以用于数字模型的测试。

多模态接口交互

通过语言和行为的自然存在的形式与真实物体进行交互,比如,说话,触碰,自然手势,凝视等。多模态交互能让用户灵活的组合多种模态,更方便用户与增强现实系统的交互。

AR技术常见的表现方式

基础3D模型

3D模型(静态或动态)是AR技术最基本的展现形式,比如动漫人物、建筑、展品、家具等。目前,国内AR行业正属于前期发展阶段,3D模型表现形式主要应用于AR初级移动app类产品。这种变现方式虽然是最基础的,但也是目前应用场景最广、开发成本最低、市场普及最好的产品。

视频

相对于简单的3D模型,酷炫的视频展示无疑更能博人眼球,在商业运营中,这种展示方式带来的经济效益会更好。比如,本来是普通的产品安装说明、菜单讲解、宣传单介绍,一旦应用AR技术,那么它就不再是一张平面的图片,而表现出立体形象了,表述也变得准确生动起来,有一种魔幻的感觉。在类似的场景应用中,AR技术都有巨大的市场空间可供挖掘拓展。在这里,需要提醒的是,利用AR技术实现视频播放并不难,难的是制作一段适合AR情景播放的宣传片,这就需要各位脑洞大开、细心雕琢了。

透明视频

初次看到的时候,感觉它更像是使用了超高清的3D人物模型,但严格的说,这是做了特殊处理的透明视频展示的效果。这种视频没有3D模型的高额成本,但却有逼真的演绎效果。如果在大型海报、宣传册、商场活动等场景中,设计好了,可是会有超级赞的效果。

场景展现

它可不是简单的一个个3D模型加上去就算完事了,场景展现虽然类似基础3D模型叠加,但实现起来要比单一3D模型复杂的多,场景里包含的更多,应用范围也更加广阔。比如娱乐、立体阅读、游戏等应用都会需要场景展现,当然这类场景的建设需要内容的支持。AR的场景展现不同于VR建造的全场景,AR场景展现是基于现实并与现实相互交错的,这也正是AR技术的迷人之处。

AR游戏

AR技术在游戏方式方面也带来了巨大的革新。目前像《Pokemon Go》、《小龙斯派罗》、《幻实新英雄卡》等,都是非常不错的AR游戏。想象一下,往后的游戏不再需要复杂的场景建模,而是在真实的世界里游戏,同时在真实的世界里又能出现许多虚拟叠加进去的事物,这是一种多么棒的体验!游戏也能摆脱场地与空间的束缚,可以随时随地开始。

VR结合

AR与VR技术共同丰富着我们的现实世界,AR技术旨在增强我们所处世界的内容,而VR技术则是将我们的注意力从现实中转移到一个虚拟的空间。AR和VR要是相结合起来,相信会有更好的体验,比如有了VR设备+AR显示,你也不在需要导游或者讲解员了,借助VR,让AR所反馈出来的增强信息会实时地出现在你所聚焦的物体旁边,告诉你这是什么,甚至还会告诉你关于它的详细信息。未来像这样的结合还可以体现在导航、医疗等领域。

大屏互动

大屏互动作为AR技术展现的延伸,其表现效果也是很让人惊喜的,主要应用于商场、博物馆、体验馆、大型活动(演唱会)等。大屏互动,简单来讲就是AR技术加投影,营造更为真实、震感的场景和氛围。

AR增强现实的应用领域

现如今,增强现实的用途已是十分广泛,接下来我们队其中一些代表性的领域做一些介绍。

体育娱乐与游戏

增强现实的发展,对于娱乐业有着极大影响。增强现实产生的三维虚拟事物,能够增强我们的娱乐感触,将各种娱乐,变成当今最前沿的科技体验。

增强现实目前常用于体育赛事的电视转播中。比如在美国橄榄球比赛的电视转播中,可以获取比赛场上的真实的场地和运动员,添加虚拟黄线表示第一次进攻线,通过增强现实的技术将虚拟的黄线融入真实的场景。而在游泳比赛的电视转播中,水道之间常常被加上一些虚拟的线条,用于显示当前比赛中运动员的位置;而比赛结束时的标示也可以清楚的显示运动员的名次和成绩。这些增强现实技术在体育运动转播中的运用,给能观众更清晰的视角,更全面立体的分析,更优质的赛事体验。

游戏产业是一个全球性的大行业,而增强现实的技术的反正,也一定会被游戏产业应用。索尼公司新推出的游戏平台PS Vita就是其中之一。这款移动社交网络平台具有增强现实功能,无论玩家身处何地,他们都能使用当前环境开始游戏,并获得更具有沉浸感的游戏体验。而微软公司的Kinect可以根据使用者信息添加虚拟物体,达到例如模拟面具,大头娃娃等效果。

此外,增强现实对于三维会议,社交网络,电影电视,旅游等方面的影响也在逐步的增强,交互式电视,交互式电影,实时翻译,方向提示等技术的运用也极大的丰富了人们的生活。

教育

近年来年教育事业的支出不断的升高,教育事业也不断的受到社会的注视。然而由于一些条件的限制,有些位置由于受阻无法通过其他方式接近的区域,比如正在运行的发动机,而通过增强现实的技术,可以让我们更清楚的了解这些区域的内部情况。同时,增强现实也可以在很多方面为学习增加一个新的维度,比如通过增强现实识别环境的物体并尝试用正在学习的语言描述他们,来练习外语。可见,增强现实在影响和改善教育方面的潜力是巨大的。

增强现实通过三维图形或动画,音频或视觉信息等方式来增强特定内容,实现增强现实图书,能够给平面的纸质书籍,甚至嗲你在书籍注入新的活力。也可以创建一个具有沉浸性,游戏性的学环境,让多人实现协作式学习。

修理和维护

由哥伦比亚大学的Steve Henderson和Steven Feiner程序的增强现实维护修理(简称ARMAR)程序是增强现实在这一领域的著名应用案例。ARMAR科技吧计算机图案定位在需要维护的真是设备上,从而提高机械维护工作的效率,安全性和准确性。增强现实辅助维修技术,能够使工程师尽快的确定故障位置,并开始修理工作,极大的减少工作消耗的时间。

此外,数字化的用户指南手册,采用增强现实技术,将手册的文本和图片叠加显示在真是的设备上,并提供分布指令,会是个指南手册共容易理解。

医学

医学领域中增强现实技术的运用是最振奋人心的。尽管医生和外科专家能熟练的运用现代医学设备,但他们只能用裸眼检查病人,虽然核磁共振或是X射线得出身体内部的影像,但这毕竟不是人能直接看到的。而增强现实技术的应用,能为医生提供类似X射线透视视觉的病人体内的影像,并且是彩色全谱图,不只是黑白二值得图像。

增强现实能使医生看到有效的逐层的餐刀病人内部的情况,掌握手术精确的位置,避开其他的重要位置,方便医生手术的进行。增强现实技术也能用于治疗某些恐惧症,以及改善人类的总体健康,比如控制饮食。

商业贸易

人绝大多数活动的基础是商业与贸易,而增强现实也被强有力的运用到业务的创建和维护,以及维持或增加市场份额等方面。

二维码目前已经在广告领域广泛的运用了,而将二维码与增强现实相结合,可以使用二维码作为增强现实的标志物,可以完美的避免注册的问题。对美每一个请张先生系统,注册信息往往是不同的,而二维码的使用,可以让增强现实系统从不通用的,封闭的系统变为通用的,开放的系统。因此这两者的结合,会使得新兴广告超越原本的广告。

在广告牌,海报,以及一些汽车广告,都已经使用了增强现实的技术,方便用户连接相应的信息以及方便订购。而在百货公司中的增强现实系统,可以让购物者不用拿起实体,便可以体验,尝试各种商品。

Posted in 沐鸣2平台注册 | Tagged | Leave a comment

沐鸣2注册开户_干货 | 深度解度投影显示技术

在投影机没有出现之前,我们都以幻灯机为主。其实现在的投影机也是特殊形式的幻灯机,有学者研究表明,投影机、动画、电影的发展是分不开的。

最早利用的光影技术始于十七世纪一个名为阿塔纳斯珂雪耶稣会教士发明的“魔术幻灯”,后来已经变成玩具,而它的现代名字叫投影机。最初,这种技术主要用在娱乐上,利用光与影的原理将故事放在一个屏幕上讲,有点类似于唐朝的皮影戏。但是,后来随着光影技术的发展,投影机与电影、动画分离出来。

投影机始祖——CRT投影技术

CRT投影机的历史可以追溯到上世纪50年代,当时主要应用在商务飞机上,进行录像带的播放。到了80年代,个人电脑的迅速发展,使得文本和数据展示的市场需求越来越大,促使了CRT投影技术的长足发展。投影技术的应用领域开始渗透到会议室、教师和剧院等。80年代中后期,随着计算机工作站和图形处理软件的广泛应用,也就相应地产生了能投影高分辨率图形和动画的图形投影机。1989年第一台LCD投影机面世,结束了投影机市场上只有CRT一种技术的局面。1994年,家用投影市场萌芽,CRT投影机相对于当时的LCD投影机技术更成熟,因此开始进入高端家庭影院。但在1996年3LCD技术推出、第一款DLP投影机横空出世,CRT投影技术便开始走下坡路,并迅速淡出人们的视线。

LCD投影技术

说到LCD投影技术,就必定要说到爱普生。作为液晶投影机核心的液晶芯片是整个投影系统的心脏。爱普生在液晶投影机的发展历史中最重要的贡献之一就是研制成功了世界上第一块LCD投影板芯片,并于1989年制造出世界上第一台LCD投影机VJP-2000,由此开创了LCD投影机的新时代。

经由技术和产品的不断进步,液晶投影在全球数字投影机技术中的领头羊位置也保持到了今天。和后起之秀DLP和LCOS技术先比,LCD的市场份额高达55%以上。

液晶投影技术的分类

在液晶投影机的技术演进过程中,其技术种类也出现过分化。除了现在占据绝对主流的三片式高温多晶硅液晶板(HTPS)技术外,还出现过单片式的技术、液晶光阀投影机等。

单片液晶投影机的工作原理如图:

单片式液晶投影机以普通的小屏幕液晶显示器用面板为显示核心芯片,配以必要的其他设备组成完整的工作光路,通过镜头系统提供大尺寸的现实画面,为用户展示具有震撼力的影像效果。在光路上,这种产品受制于芯片面积过大的影响体积难以缩小,光路的总光效利用率也很低,内部的光学、机械部件的工艺结构精确在0.1mm。主要光学部件的选择时,比如投影灯泡、反光碗、反光镜、投影镜头、聚焦镜、菲涅尔镜等,拥有着成熟的产业链,能够提供良好的产品体验。

液晶光阀投影机是一种历史上出现的技术形态。它本质上是利用液晶的光学开关作用改进CRT投影机的成像效果的产物。

液晶光阀投影机采用CRT管和液晶光阀作为成像器件。是为了CRT投影机解决图像分辨率与亮度间的矛盾而生的产品。一般的光阀主要由三部分组成:光电转换器、镜子、光调制器,它是一种可控开关。通过CRT输出的光信号照射到光电转换器上,将光信号转换为持续变化的电信号,外光源产生一束强光,投射到液晶光阀上,由内部的镜子反射,通过光调制器,偏振滤光片的处理令光阀投射光线与CRT信号相复合,投射到屏幕上形成画面。

3LCD投影技术

3LCD投影技术和液晶投影机的主流技术。其市场份额占据液晶投影机市场的绝大部分,已经成为行业内的事实性标准。

3片液晶显示投影机的光路原理,由高亮度、高色温金属卤化物灯(UHE)发出的光经抛物线型灯碗反射形成平行光线,射人第一透镜阵列(单元聚光透镜组),经第二透镜阵列(偏振光转换透镜组)提高偏振光的利用率,再经过分光光路,形成三原色三束光线,分别射人R,G,B三个液晶板,然后由一体化棱镜汇聚3色光,投影镜头将3色合成图像投影在屏幕上。

在这一投影过程中,各种光学器件和液晶面板芯片、灯泡光源各自起着各自的作用。其中光源普遍采用金属卤素灯、UHP(Ultra-High Performance,超高性能)灯和UHE灯。金屑卤素灯成本低、价格便宜,缺陷是发热量很大、半衰期很短。半衰期是指灯的亮度下降到设计亮度一半时所用的时间。为克服金属卤素灯发热量大、半衰期短的缺陷,冷光源应运而生,出现了UHP,UHE金属卤化物灯。UHP,UHE灯比起金属卤素灯发热量小得多。此外包括激光光源、LED无机发光二极管等新型光源也成为了各家企业开发新技术的焦点对象。

除了光源外,一系列的光学器件的作用也不容小视。投影过程需要的是面状的均匀平行三原色线偏振光源。而普通灯泡发出的光线则是白色的球形圆偏振光。通过一系列透镜、楞镜和滤光镜的调整,灯泡的发出的光才能成为满足投影机投影需要的光源。

在液晶投影机的成像过程中,处于核心地位的是液晶面板芯片。在实际工作中,液晶面板芯片起着光学开关的作用。芯片上每一个独立的有源矩阵控制下的像素点能够独立变化,进而控制投射过液晶半的这一点的光线的多少。通过三块液晶板对三元的分别控制,并经过最后的画面合成,就可以成为色彩丰富、明暗变化的彩色投影画面。在经过镜头的放大投射在屏幕上,消费者就可以欣赏到如同电影一般的出色大尺寸影像了。

LCD投影技术的芯片

液晶芯片是液晶投影机最核心的部件,。它不仅是液晶投影机重要的成本构成要素,同时更是决定着整台产品的品质性能和寿命的重要组件。

LCD是Liquid Crystal Display(液晶显示)的缩写。液晶既有液体的流动性,又有晶体的光学各向异性,常称为“液态晶体”。液晶材料工作温度为一55一十77℃。液晶分子间作用力小,在电场作用下,分子排列变化,导致液晶对光的透射率和反射率变化,称为液晶的电光效应。在液晶显示技术中,正式利用这种特殊的物质性质,将液晶材料做成可以控制光线进出的开关,进而达到成像效果的。

液晶显示板是在两玻璃基片之间充入液晶材料,并在玻璃基片表面贴线偏振片、扫描电路、薄膜晶体管(TFT)等构成的。当某一象素的行电极加上扫描电压,薄膜晶体管(TFT)导通,该液晶象素透光。玻璃基片之间的液晶单元构成一个个光开关,控制着透过液晶的光线的多少,显示出色彩明暗的变化。

在实际的产品开发中,投影机用到的液晶面板芯片要经受住背后的灯泡发出的巨大能量(主要是热量)的考验。这就决定了液晶投影机用的液晶和普通液晶显示器、液晶电视机应用的液晶,拥有着必然的区别。目前,液晶投影机采用的主要是被称为“高温多晶硅液晶板(HTPS)”的技术。

HTPS是High Temperature Poly-Silicon的缩写,翻译成中文是“高温多晶矽”的意思,一般俗称高温玻璃。它是液晶显示家族中的一支,也属于主动点矩阵(TFT)式LCD(Active Matrix LCD)。

HTPS液晶芯片最大的特性在于持续高温工作的稳定性,这位投影机产品提高整机寿命、提升产品亮度提供了基础技术平台。同时,这一技术的产品还具有色彩还原准确、视觉感舒适的等特点。目前,该技术已经成为了全球数字投影领域最重要的组成技术。

LCD投影技术的发展瓶颈和进步

作为液晶投影技术的核心,LCD芯片的进步一直是液晶投影产业发展的风向标。

在早期的LCD液晶投影机中,寿命、亮度和体积问题成为了制约产品进步的主要问题。由于液晶投影机的核心材料是高分子的液晶材料,其在高温下的老化作用很明显。同时作为液晶面板基板的玻璃,也可能由于长时间的高分烘烤而发生光学性能的变异。这两点导致,在早期的液晶投影机,特别是上世纪的时候芯片寿命不足5000小时,这使得消费者的实际使用成本大幅增加。

早期的液晶投影机产品中,液晶芯片如何实现更加精细的TFT薄膜晶体管及其控制电路成为了液晶投影芯片小型化、高开口率化的最大难题。采用三片式设计的整个光机系统,如果不能实现芯片体积的缩小,整个产品的小型化无从谈起。而一旦芯片变小,片上控制电路组件如果不能大幅简化和缩小,则导致整个芯片可用于光学开关的面积占芯片整体的比例(开口率)的下降,进而造成光利用率的下降和亮度的降低。

此外,液晶显示的另一个特性是画面的拖尾和黑色画面的黑位欠缺。液晶分子受电磁场影响的偏转需要一定的时间,同时也具有滞后性,这导致了液晶显示产品画面的拖尾现象的出现。采用透射光路的液晶投影芯片,很难做大100%阻断光线的透过,因此产生了黑色画面不够黑的现象,整体画面的对比度和暗部细节展示受到了很大的影响。

近年来随着液晶投影机技术的不断发展,以上问题已经得到了很好的克服。在液晶投影机芯片技术的进步中,追求小尺寸、高开口率、高寿命、更高的灰阶控制精度位数以及更高的画面刷新频率是最主要的内容。目前最先进的芯片能够实现,一英寸以下的1080p像素、超过50%的开口率、12位以上的精细控制以及120HZ的超高速刷新速率。这些方面的巨大进步,令LCD液晶投影机已经进步一个崭新的发展阶段。

DLP投影技术

DLP是由德州仪器公司基于其研发的数字微镜装置(Digital MicromirrorDevice,DMD),所创造的一种真正全数字反射式的投影技术。DMD是由上百万片面积10.8×10.8微米,比头发的断面还小的微镜片所组成,每个微镜片都能将光线从两个方向反射出去;当数字信号处于“ON”状态时,微镜片会旋转至+12度,若数字信号处于“OFF”状态,微镜片会旋转至-12度。

微镜片在前后急速旋转之际形成灰阶,再搭配一颗或三颗DMD芯片,即可得到栩栩如生的彩色显示效果。配有一颗DMD芯片的DLP投影系统称为”单片DLP投影系统”,经色轮过滤后的光,至少可以生成1,670万种颜色;而采用3片式的DLPCinema投影系统则可生成3,500万种颜色。目前DLP推出最新的”极致色彩”技术,甚至能创造超过200兆种颜色。

根据DLP投影机中包含的DMD数字微镜的片数,人们又将投影机分为单片DLP投影机,两片DLP投影机和三片DLP投影机。

目前市场上出现的DLP投影机,有许多都属于单片机,这种单片DLP投影机主要适用在各种便携式投影产品中,这种投影机的整个机身一般小于A4纸张的面积,专为流动行政人员而设计,外壳一般是典雅优美的镁合金外壳,不要看这种单片DLP投影机的体积小巧,但它的功能可强大的很呢,清晰度高、画面均匀,色彩锐利,有了这种投影机,大家要工作时,可以随时把它塞进公文包里,马上出发,直接给客户展示色彩绚丽、画面清晰的效果。

两片DLP投影机与单片DLP投影机相比,多使用了一片DMD芯片,其中一片单独控制红色光,另一片控制蓝、绿色光的反射,与单片DLP投影机相同的,使用了高速旋转的色轮来产生全彩色的投影图像,它主要应用于大型的显示墙,适用于一些大型的娱乐场合和需要大面积显示屏幕的用户。

三片DLP投影机,三片DMD芯片分别反射三原色中的一种颜色,已经不需要再使用色轮来滤光了;使用三片DMD芯片制造的投影机亮度最高可达到12000ANSI流明,它抛弃了传统意义上的会聚,可随意变焦,调整十分便利;只是分辨率不高,不经压缩分辨率只能达到1280×1024这样的标准,它常常用于对亮度要求非常高的特殊场合下。

DLP投影技术特点

作为先进的数字技术,DLP具有高清晰度、高可靠性、高防尘性、高对比度、高反应速度、高便携性、高性价比的特点:

高清晰度

DLP技术的核心是数以万计的镜片组成的数字微显镜系统,每块镜片之间的距离不到1微米,可以极度缩小投影图像像素之间的距离,生成无缝的数字化图片,在任何尺寸下都可以保持良好的锐度,不会出现其它技术造成的晶格(马赛克现象),这也是采用DLP技术投影的图像总能保持水晶般清晰的原因。

高可靠性

DLP是数字技术,数字投影技术的优势在于能完整、忠实地重复产生影像,不会受到温度、湿气或震动等因素的影响;而DLP芯片超过10万个小时的使用寿命,确保画面不会褪色。

高防尘性

对于占国内市场份额45%以上的教育用投影机来说,最关键的一项附加功能就是防尘。采用DLP技术制造的投影机,可采全封闭式的光机设计,DLP芯片和其他部件都可以受其保护,灰尘难以接触到光路核心,从而确保图像质量不会受到灰尘影响,保持如一。

高对比度

在观看影片时,影像呈现的立体感至关重要。因为人体的视觉器官是依赖对比值来辨识物体的边缘,因此具高对比值的影像看起来更加锐利。当对比度低,暗色部位即呈模糊一片,影像显得平坦且欠缺真实感。对于教学上常用到的文本教材(PowerPoint、Excel、Word形式的档案),DLP技术的高原始对比值能够清晰、锐利的呈现文字,这是其他强调动态对比度的技术无法比拟的,因为在呈现文本内容时,投影机需要的是高”原始”对比度。

高反应速度

DLP技术的切换速度快,仅数微秒,比液晶面板以毫秒计的反应速度快了千倍之多。正因为具备如此快的响应速度,即使是赛车或球类等高速动态影像,都不会出现拖尾现象,呈现出最清晰而逼真的影像。

高便携性

应用于教育、商务、消费市场的单芯片DLP投影机只需要一块面板,而所有其它投影技术则需要三块。因此DLP的投影系统可以做得很小,重量也相应轻了许多,为创新设计留下充分的空间。目前全球已经有三星、三菱和东芝等多家厂商推出不到一磅重的DLP口袋型投影机,开启投影机应用的新纪元。

LCOS投影技术

LCOS投影技术是2000年以后发展起来的最新投影技术,是一种新型的反射式投影技术,与穿透式LCD和DLP相比,LCOS具有利用光效率高、体积小、开口率高、制造技术较成熟等特点,它可以很容易的实现高分辨率和充分的色彩表现。LCOS技术在日后大屏幕显示应用领域具有很大优势,其没有晶元模式,且具有开放的架构和低成本的潜力。

近几年来,在LCD业界出现了许多新技术,其中较热门的技术LCOS的最大优点是解析度很高,在携带型资讯设备的应用这个优点是其他技术无法与之看齐的。

其实Lcos相对于其他的投影技术最大的区别就在于控制光线分解及合并的光路设计部分,也就是如何通过图像中像素信息去调节RGB各分量的大小(就是调制过程)。LCD和DLP调节RGB分量使用的是光透射模式,会损失很多光线。而Lcos采用的是反射技术,光损失没那么多!而且在设计上,Lcos液晶面板的开口率也比前两种大很多,这样当然会减少功耗。

LCOS的结构是在单晶硅上生长电晶体,利用半导体集成制作驱动面板(又称为CMOS-LCD),然后在电晶体上透过研磨技术磨平,并在上面镀铝膜电极作为反射镜,形成CMOS有源点阵基板,然后将CMOS基板与含有ITO透明电极之上玻璃基板贴合,再抽入液晶,进行封装。像素电极同时也作为反射镜,像素的尺寸一般可以做的很小约为7~20μm,开口率高达96%,对于百万像素的高分辨率的基板的大小还不到一英寸。

面板结构面板结构面板结构面板结构LCOS(Liquid Crystal on Silicon)属于新型反射式微LCD,其结构是在硅片上“生长”液晶,利用集成电路工艺制作驱动面板(又称CMOS-LCD),经过研磨技术磨平后镀上铝当反射镜,形成CMOS基板,再将CMOS基板与含有透明电极的玻璃(ITO)极板贴合,再注入液晶,进行封装(见图 1)。在单晶硅片上集成CMOS和存贮电容器的数组,通过开孔把漏电极和像素电极连结,像素电极用铝做成反射电极。为防止强光照射沟道,加一层金属挡光层。另一侧基板是ITO电极的玻璃板。液晶层盒厚受像素尺寸限制,一般盒厚为几微米。

LCOS投影显示技术原理

LCOS投影机的基本原理与LCD投影机相似,只是LCOS投影机是利用LCOS面板来调变由光源发射出来欲投影至屏幕的光信号,当光线照射到LCOS芯片时,其反射光就受到CMOS电极和ITO电极之间电压的调制,因此LCOS芯片实际上是一种光调制器件。利用这种特性,将图像或数据信息转换为CMOS电极数组的电压,就可以实现反射光的成像。光源的光经过极化和传输系统到棱镜分光为红绿兰三种光并照射到LCOS芯片上被图像调制,调制后的光线在经光会聚系统合成后进入投影镜头并照射到屏幕上成像。

LCOS面板是以CMOS芯片为电路基板,因此无法让光线直接穿过,其分光合光系统设计和LCD投影机有些不同,通常需要在分光合光系统中利用偏极化分光镜(Polarization Beam Spliter;即PBS),将入射LCOS面板的光束与反射后的光束分开。

由光源所发出的光经由Dichroic Mirror(双色镜,即是二色过滤片)后分成R、G、B三色光,此三色光分别通过各自的PBS后,会反射S偏光进入LCOS面板,当液晶显示为亮态时,S偏光将改变成P偏光,最后以双色棱镜(Dichroic Prism,即会聚透镜)组合调变过的三道偏极光,投射至屏幕处得到影像。

LCOS调试原理

LCOS投影机图像调制原理和LCD基本相同,也是以光调制来控制投影显示图像。入射光线在分光后,经过入射偏光板(PBS),将入射光变成S偏光,经LCOS板反射调制。如果液晶经外部信号调制,处于显示亮态时,S光会变成P光,经棱镜透射后,有最多的光投射到会聚透镜会聚成像。处于显示暗电平时,S光经调制,依然还是S光输出,经棱镜没有光透射到会聚透镜,图像显示为暗电平。因此,输出到会聚透镜的光的多少是由每个像素的外部信号调制决定的。

不同投影技术比较

CRT、LCD、DLP及LCOS投影芯片的参数比较

CRT、LCD、DLP及LCOS投影芯片,各有各的技术特点,以CRT投影的色域为标准,从下图可以明显看出,LCD与其衍生出来的LCOS投影芯片的色域是非常宽广的,其色域范围要远远大于CRT及DLP芯片所能表现的范围。

作为对于色域范围敏感的应用领域,三片式LCD及LCOS投影芯片是这些领域的首选。但由于其芯片上集成了大量的TFT(ThinFilmTransistor薄膜晶体管),在生产过程中难免有损坏、失效的TFT,其一直处在导通或截止状态,不可避免的造成了影象中出现的亮点或暗点,而且,这种损坏的TFT还随着使用时间的延长而继续增多。这是目前LCD、LCOS芯片的软肋。DLP的特点是高对比度及高可靠性。

CRT、LCD、DLP及LCOS投影元件的性能对比表:

LCD与DLP投影影像效果比较

Posted in 沐鸣2平台注册 | Tagged | Leave a comment

沐鸣2平台直属_百度“声音克隆”:一个半小时就可复制你的声音

日前百度发布了一篇新论文介绍了自己在语音生成方面的最近进展。之前的 Deep Voice 系统已经可以生成高质量的语音,而现在,百度新开发的语音生成系统不仅可以把说话声音从固定的一种增加到了上千种,得以模仿数千个不同说话者的声音,而且每个说话者只需要不到一个半小时的训练数据。

这种惊人表现背后的技术理念就是从不同说话者中独立学习共通的和差异性的信息。而且在此基础上,百度的研究人员们打算更进一步,尝试只从几秒长度的短句中学习说话者的声音特点。通常我们把这类问题称为「语音克隆」。在人际交互接口的个性化订制场景中,研究者们预期语音克隆很可能会有重要作用。

为了解决语音克隆问题,在这项研究中百度的研究人员们把注意力主要放在了两种基础方法上:讲话人适配(speaker adaptation)和讲话人编码(speaker encoding),具体细节可参考上图。两种方法都可以用在带有讲话人嵌入(speaker embeddings,https://arxiv.org/pdf/1710.07654.pdf )的多讲话人语音生成模型中,同时还不降低生成的语音的质量。在生成语音的自然性和相比原讲话人的相似性方面,两种方法也都只需要很少的克隆样本就可以展现良好的表现。

讲话人适配方法是使用数个克隆样本,通过基于反向传播的优化方法对多讲话人语音生成模型做精细调节(fine-tune)。适配方法可以作用于整个模型,或者只作用于低维度的讲话人嵌入;后者表征每个讲话人所需的参数数量要少得多,尽管需要更长的克隆时间,生成的语音的质量也要稍差一些。

讲话人编码方法中需要训练一个单独的模型,用它直接从要克隆的语音样本中推断出新的讲话人嵌入,然后再把这个讲话人嵌入用在多讲话人语音生成模型中。这个讲话人编码模型中带有时域和频域的处理模块,可以从每个音频样本中提取得到关于讲话人身份的信息,然后用注意力模块把这些信息以最优方式结合起来。讲话人编码方法的好处包括克隆速度快(只需要几秒时间)、表征每个讲话人需要的参数数目少,使得这种方法更适用于在资源有限的环境中使用。

除了在研究中准确估测讲话人嵌入外,百度的研究人员们还发现讲话人编码器可以学会有意义地把不同的讲话人映射到嵌入空间中。比如,来自不同地域、性别、口音的讲话人可以被分别聚类。通过在学到的隐含空间中进行操作,就可以把某个说话者的性别或者口音转换成图中的样子。根据研究员们的测试结果表明,对于为新的讲话人生成语音以及模仿讲话人的声音特点,他们所提的方法非常有效。

AAAI 主席 Subbarao Kambhampati 也饶有兴趣地转发了百度介绍这项成果的技术博客,希望这个技术抓紧实用起来,只要设置好了自己的声音,哄小孩睡觉的时候就再也不用花时间讲睡前故事了,有声读书器就可以用爸爸妈妈的声音讲故事。

Posted in 沐鸣2平台注册 | Tagged | Leave a comment

沐鸣2注册地址_eSIM带来行业变革 消费电子领域将迈出重要一步 如何保障技术安全

近日,缘于中国联通和苹果公司在国内发布了首款eSIM可穿戴终端,一时间eSIM(embedded SIM)得到了国内消费者的广泛关注,这也是eSIM技术诞生后,在消费电子领域迈出的重要一步。

不仅在消费电子领域,eSIM未来还有望将在物联网领域大有可为。但是,空中写卡(OTA)的技术为eSIM发展提供了便利条件,也为其带来了安全隐患。

为了解eSIM的连接能力与安全防护能力,通信世界全媒体记者采访了上海果通科技(roam2free)首席安全官吴俊,吴俊详细讲解了安全问题对于eSIM行业发展的重要性。

eSIM带来行业变革

eSIM最早的定义是嵌入式eSIM卡,但是随着业界对eSIM的理解不同,出现了多种版本的eSIM方案,目前公认的是eSIM支持空中写卡(OTA)。eSIM行业兴起不久,如今处在全面创新爆发的时期,而果通在eSIM发展初始阶段便开始了相关研究,如今已经发布了多种eSIM解决方案。

“以前运营商通过SIM卡给客户提供服务,而在eSIM时代,无论是物联网领域还是消费电子领域,硬件设备需要设备商自行采购,设备商向运营商采购服务而不是采购SIM卡实体,因此如何实现设备商和运营商的对接,使设备更好地接入运营商网络是果通在做的事情。”吴俊介绍了果通科技的战略初衷。

设备商只采购eSIM设备,但是业内存在众多eSIM解决方案,而且设备商还要与众多运营商网络对接,包括海外运营商。加之运营商并不了解众多设备厂商的产品特性,而果通可以提供连接使能服务,帮助运营商和设备商更好地对接。
与恩智浦联合发布最小eSIM芯片

果通并不提供硬件,在软件方面,果通主要和恩智浦合作。在今年2月份的MWC巴塞展上,NXP(恩智浦半导体)与果通联合举办了以物联网安全与连接为主题的发布会,会上展示了全新的eSE& eSIM 融合芯片解决方案,并推出集成度最高的“一体式”芯片组SN100U,以及世界上体积最小的安全原件单片芯片SU070。两款芯片均包含eSIM功能,果通科技为其提供eSIM软件及连接功能。

关于此次合作,吴俊表示,此次合作果通帮助恩智浦两款芯片实现了eSIM功能,果通与恩智浦的合作使得eSIM更加安全。恩智浦是芯片提供商,其芯片主要应用在安全要求等级很高的领域如信用卡等,其安全级别一般为EAL6+,而SIM卡的安全级别一般是EAL4+。果通在eSIM安全方面也做得十分出色,所以二者的合作可以使eSIM在较高的安全级别上工作。
果通让连接更安全

为何果通如此重视安全问题?因为,安全是未来实现大连接的重要保障。

吴俊表示,如果未来物联网时代eSIM上传的数据被攻击,产生的后果是无法想象的。eSIM被攻击的情况主要有三种,第一种是硬件攻击,即对方拿到了芯片,这种情况对防护等级要求最高,需要EAL6+级别的安全保障;第二种是软件攻击,远程窃取芯片上传的数据,这种要求EAL4+级别的安全保障;第三种是用户自己破解,这种情况下,可以通过将芯片绑定设备,从而保证芯片数据的安全。针对不同的攻击方式,果通有不同的安全解决方案从而提供高等级的安全防护。

例如,黑客在云端通过连接平台去窃取数据,在这种情况下果通可以提供安全的连接服务,将所有发送数据进行加密,这样即使黑客窃取到的也是加密数据,充分保障了安全性。所以果通致力于“让连接更安全”。即不仅提供连接,更提高连接的安全性。

关于此次中国联通开放eSIM一号双终端试点,吴俊表示,这对eSIM产业起到了极大地鼓舞作用。消费电子一直是各方认为的eSIM较好实现的突破场景,至于手机终端普及eSIM,可能还有很长的路要走。中国联通对eSIM的态度比较积极,很早就开始与苹果之间的调试,如今公布上市,为未来可穿戴设备的发展提供了良好的借鉴。

在物联网领域,eSIM可以帮助减小终端尺寸,提高模组抵抗极端条件的能力,实现更加全面的大连接。因此未来果通还将全面推动eSIM在物联网领域的普及。

eSIM在国内方兴未艾,物联网市场尚未大规模爆发,因此在二者的结合方面,还有很多工作要做。

Posted in 沐鸣2平台注册 | Tagged | Leave a comment

沐鸣2平台直属_听音的立体感是如何形成的?

1 立体声的概念

 立体是一种几何概念,是指在三维空间中占有位置的事物。那么声音也是立体的吗?从类比上来说,回答可以是肯定的。因为声源有确凿的空间位置,声音有确凿的方位来源,人们的听觉有辨别声源方位的能力;尤其是当有多个声源同时发声时,人们可以凭听觉感知声群在空间的分布状况。因此可以说声音是“立体”的。不过,更妥当的说法应该是:“原发声是立体的。”因为当声音经过记录、放大等处理过程而后重放时,所有的声音都可能从一个扬声器中放出来,这种重放声就不是立体的了。这时由于各种声音都从同一个扬声器中发出,原来的空间感–特别是声群的空间分布感–也就消失了。这种重放声叫做“单声(Mono).如果重放系统能够在一定程度上恢复原发声的空间感,那么这种重放声就叫“立体声”(Stereo)。由于原发声不言而喻是“立体”的,所以,立体声一词特指那种有某种空间感(或方位感)的重放声。

2 双耳效应

为了在重放声中恢复空间感,首先要了解人类的听觉系统为什么有辨别声源方位的能力。研究发现,这主要是因为人们有两只耳朵而不仅仅是一只耳朵的缘故。
耳朵生长在头颅的两侧,它们不仅在空间上有距离,而且受头颅阻隔,因此两耳接收到的声音可能会有种种差异。正是主要根据这些差异,使人们得以区分声源在空间的位置。这些差异主要有如下几种:

(1)声音到达两耳的时间差

由于左右两耳之间有一定距离,因此险了正前方和正后方来的声音之外,由其他方向来的声音到达两耳的时间就有先后,从而造成时差。如果声源偏右,则声音必先到达右耳而后左耳;反之,则必先到达左耳而后右耳。声源越是偏向一侧,则时差也越大。实验证明,如果人为地造成两耳听音的时差,就可以产生声源偏向的幻觉。当时差到达0.6ms左右时,就感到声音完全来自某一侧了。

(2)声音到达两耳的声级差

两耳相距虽然不远,但由于头颅对声音的阻隔作用,声音到达两耳的声级就可能不同。靠近声源一侧的声级较大,而另外一侧较小。实验证明,最大声级差可达25dB左右。

(3)声音到达两耳的相位差

大家知道声音以波的形式传播,而声波在空间不同位置上的相位是不同的(除非刚好相距一个波长)。由于两耳在空间上有距离,所以声波到达两耳时的相位就可能有差别。耳朵内的鼓膜是随声波而振动的,这个振动的相位差也就成为我们判断声源方位的一个因素。实验证明,即使声音到达两耳时的声级、时间都相同,只改变都相同,只改变其相位,我们也会感到声源方位有很大差异。

(4)声音到达两耳时的音色差

     声波如果从右侧的某个方向上来,则要绕过头部的某些部分才能到达左耳。已知波的绕射能力同波长与障碍物尺度之间的比例有关,人头的直径约为20cm,相当于1,700Hz声波在空气中的波长,所以人头对千余赫兹以上的声音分量有掩蔽作用。也就是说,同一个声音中的各个分量绕过头部的能力各不相同,频率越高的分量衰减越大。于是左耳听到的音色同右耳听到的音色就有差异。只要声音不是从正方向上来,两耳听到的音色就会不同,从而成为人们判别声源方位的一种依据。

(5)直达声和边疆反射声群所产生的差别

由声源发出来的声音,除直接到达我们双耳的直达声之外,还会经周围障碍物一次或多次反射而形成反射声群,陆续到达人们的双耳。因此直接声和反射声群的差别,也就会提供声源在空间分布的信息。

(6)由耳廓造成的差别

耳廓是向前的,显然能使人们区分前后。另一方面,耳廓的形状十分微妙,不同方位上来的声音会在其中发生复杂的效应,肯定也会提供一定的方位信息。
实践证明,以上种种差别,以声级差、时间差、相位差三种对听觉定位的影响最大。但是,在不同条件下它们的作用也不相同。一般地说,在声频的低、中频段,相位差的作用较大;中、高频段以声级差的作用为主。对于猝发声,则时间差的作用特别显著。而在垂直定位方面,耳廓的作用更为重要。实际上双耳效应是综合性的,人们的听觉系统理应是根据综合的效应来判决声源的方位。

顺便指出,人们的听觉系统除了有响度、音色、方位等感觉之外,还有其他许多效应。其中有一个同我们今后的讲座有密切关系的疚,叫做“优先效应”(又称“哈斯效应”)。由实验得知,当两个相同的声音,其中一个经过延时,先后到达人们的双耳时,如果延时时间在30ms之内,则人们将感觉不到延民主迟声的存在,仅能觉察到音色和响度的变化。但如果延时太长,情况将有所不同。大家已经知道,当两个先后到达的声音时差超过50ms-60ms时(相当于声程差大于17m),听音者就能感到。

Posted in 沐鸣2平台注册 | Tagged | Leave a comment

沐鸣2平台首页_脸部辨别新技术,中美团队研究红外线“变脸”

随着人工智能(AI)技术持续进步,图像辨识系统已经广泛的在生活中存在.一些设备也开始运用了脸部辨识技术来进行身份认证,但这项技术的安全性真的是无懈可击吗?

正如同先前迷幻贴纸、棉花田演唱会图片的研究,研究人员正试图透过测试任何潜在的黑客手段,让图像辨识技术能够更加安全,而来自中美两国研究团队近日则在arXiv平台上公布了一篇论文,详细介绍了他们发现如何欺骗“脸部辨识”应用的细节。

帽子中放置的红外线LED(Source:ZheZhou)

其实团队的概念非常简单,要欺骗脸部辨识应用,最直接的就是为受辨识者“替换”一张脸。为了达成这一点,团队先是运用深度神经网络解读一些人物脸部图像,再透过棒球帽中连接的微型红外线LED,将解读过的人脸图像运用无数个红外线光点投射到受辨识者脸上,进而达成掩盖身份的效果。

而当然,由于投射的是其他人的脸孔,只要概念成功,在以脸部辨识系统做为身份认证的前提下,让受辨识者冒充他人身份也是可以做到的。

为了检验这项理论,研究团队选择了4张随机照片尝试欺骗脸部辨识软件,其中也包含了美国音乐人魔比(Moby)的照片。研究人员在实验中发现,只要受辨识者与投射脸孔来源长相有些微的相似,这个欺骗脸部辨识系统的成功率约可达到70%。

下方第一列数字指的是受辨识者与投射脸孔来源对象的距离,第二列则是理论上应用后的差距,第三列则是实际差距。(Source:ZheZhou)

由于红外线(Infrared)是一种非可见光,人们单凭肉眼并无法察觉,同时贴在帽沿内侧的LED体积也非常小,甚至也可以藏在其他穿戴物中使用,即使有着人类保全也很难察觉系统被欺骗的情况,这让被利用的可能性又更加提升。

当然必须提及的是,这只是一个小型研究还未经过同行评审,因此可能存在一些争议,但基于这些研究结果和测试,团队认为以身份认证或监控关键场景的需求来说,现今的脸部辨识技术距离安全可靠还有很长一段距离。

Posted in 沐鸣2平台注册 | Tagged | Leave a comment

沐鸣2注册地址_语音识别建模的发展脉络 论声学建模与语言建模的重要性

语音识别建模对语音识别来说是不可或缺的一部分,因为不同的建模技术通常意味着不同的识别性能,所以这是各个语音识别团队重点优化的方向。也正是因为如此,语音识别的模型也层出不穷,其中语言模型包括了N-gram、RNNLM等,在声学模型里面又涵盖了HMM、DNN、RNN等模型…

简单来说,声学模型的任务就是描述语音的物理变化规律,而语言模型则表达了自然语言包含的语言学知识。本文由搜狗语音交互中心语音技术部负责人陈伟来为大家分享伴随着本轮人工智能浪潮下语音识别建模技术的演进,希望能够帮大家理清主流的识别建模脉络以及背后的思考。

搜狗知音引擎是搜狗公司自主研发的一项专注于自然交互的智能语音技术,该技术集合了语音识别、语义理解、语音交互、以及提供服务等多项功能,不仅能听会说,还能理解会思考,本文将结合知音引擎中语音识别建模技术的使用来为大家讲解。

 

图1 搜狗智音引擎

基础概念

1语音帧

考虑到语音的短时平稳特性,语音信号在前端信号处理时要进行加窗分帧的操作,识别特征都按帧来提取,具体请见图2。(编者注:分帧后的语音信号逐帧提取语音特征用于声学模型建模。

图2 语音帧的划分

2语音识别系统

语音信号经过前端信号处理、端点检测等处理后,逐帧提取语音特征,传统的特征类型包括MFCC、PLP、FBANK等特征,提取好的特征送至解码器,在声学模型、语言模型以及发音词典的共同指导下,找到最为匹配的词序列作为识别结果输出,整体流程请见图3。识别的公式如图4所示,可见声学模型主要描述发音模型下特征的似然概率;语言模型主要描述词间的连接概率;发音词典主要是完成词和音之间的转换,其中声学模型建模单元一般选择三音素模型,以“搜狗语音为例”:

sil-s+ou1 s-ou1+g ou1-g+ou3 g-ou3+y ou3-y+u3 y-u3+y u3-y+in1 y-in1+sil

图3 语音识别系统流程

图4 语音识别原理

需要注意的是,输入特征矢量X代表语音的特征。

主流声学建模技术

近年来,随着深度学习的兴起,使用了接近30年的语音识别声学模型HMM(隐马尔科夫模型)逐渐被DNN(泛指深度神经网络)所替代,模型精度也有了突飞猛进的变化,整体来看声学建模技术从建模单元、模型结构、建模流程等三个维度都有了比较明显的变化,如图5所示:

图5 声学建模演进总结

其中,深度神经网络超强的特征学习能力大大简化了特征抽取的过程,降低了建模对于专家经验的依赖,因此建模流程逐步从之前复杂多步的流程转向了简单的端到端的建模流程,由此带来的影响是建模单元逐步从状态、三音素模型向音节、字等较大单元演进,模型结构从经典的GMM-HMM向DNN+CTC(DNN泛指深度神经网络)转变,演进的中间态是DNN-HMM的混合模型结构。

1HMM

HMM最早创立于20世纪70年代。80年代得到了传播和发展,成为信号处理的一个重要方向,现已成功地用于语音识别,行为识别,文字识别以及故障诊断等领域。

详细来看,经典的HMM建模框架如下所示:

图6 HMM建模框架

其中,输出概率使用高斯混合模型GMM建模,如下:

2DNN-HMM

2012年,微软邓力和俞栋老师将前馈神经网络FFDNN (Feed Forward Deep Neural Network) 引入到声学模型建模中,将FFDNN的输出层概率用于替换之前GMM-HMM中使用GMM计算的输出概率,引领了DNN-HMM混合系统的风潮,很多研究者使用了FFDNN、CNN、RNN、LSTM等多种网络结构对输出概率进行建模,并取得了很好的效果,如图7所示。

图7 DNN-HMM混合建模框架

DNN-HMM建模框架中,输入特征使用了在当前帧左右拼帧的方式来实现模型对时序信号长时相关性的建模,模型输出则保持了GMM-HMM经常使用的trihone共享状态 (senone),中文大词汇量连续语音识别中状态数一般设置在1万左右,如图8所示。

图8 DNN-HMM建模流程

3FFDNN

FFDNN的模型结构如下所示:

图9 FFDNN建模流程

4CNN

编者注:实际上,最早CNN只应用于图像识别,直到2012年才被用于语音识别系统。

图10 CNN建模流程

5RNN及LSTM

语音的协同发音现象说明声学模型需要考虑到语音帧之间的长时相关性,尽管上文中DNN-HMM通过拼帧的方式对上下文信息进行了建模,但是毕竟拼接的帧数有限,建模能力不强,因此引入了RNN(循环神经网络)增强了长时建模的能力,RNN隐层的输入除了接收前一个隐层的输出之外,还接收前一时刻的隐层输出作为当前输入,通过RNN的隐层的循环反馈,保留了长时的历史信息,大大增强了模型的记忆能力,语音的时序特性通过RNN也得到了很好的描述。但是RNN的简单结构在模型训练进行BPTT (Backpropagation Through Time) 时很容易引起梯度消失/爆炸等问题,因此在RNN的基础上引入了LSTM(长短时记忆模型),LSTM是一种特殊的RNN,通过Cell以及三个门控神经元的特殊结构对长时信息进行建模,解决了RNN出现的梯度问题,实践也证明了LSTM的长时建模能力优于普通RNN。

图11 RNN结构

图12 RNN到LSTM

6CTC

上述的建模技术在模型训练时需要满足一个条件,就是训练数据中每一帧都要预先确定对应的标注,即对应DNN输出状态的序号,训练特征序列和标注特征序列必须是等长的,而为了得到标注,需要使用已有模型对训练数据序列和标注序列进行强制对齐,但是基于大数据训练时标注的准备比较耗费时间,同时对齐使用的模型精度往往存在偏差,训练中使用的标注会存在错误。因此引入了CTC (Connectionist Temporal Classification) 准则,解决了标注序列与特征序列不等长的问题,通过前向后向算法自动学习语音特征中的模型边界,这种准则与用于时序建模的神经网络(如LSTM)的结合可以直接用于端到端的模型建模,颠覆了语音识别使用接近30年之久的HMM框架。

CTC准则引入了blank类别,用于吸收发音单元内部的混淆性,更加突出模型与其他模型之间的差异性,因此CTC具有非常明显的尖峰效果,图13是使用triphone-lstm-ctc模型对内容为“搜狗语音”的语音进行识别后的输出概率分布,可以看到大部分区域都被blank吸收,识别出的triphone对应着明显尖峰。

图13 CTC尖峰效果演示

可以预期,基于CTC或者引用CTC概念(如LFMMI)的端到端识别技术将逐渐成为主流,HMM框架将逐渐被替代。

其他建模技术

1语言建模技术

目前RNNLM的技术已经逐步引入到语音识别中来,通过对更长历史信息的建模,RNNLM较传统使用的N-Gram技术对识别性能有了较好的提升,但是考虑到大词汇量语音识别中,如果完全替换N-Gram会带来运算量以及运算时间的大幅增加,因此在知音引擎中,RNNLM用在对N-Gram识别输出的N-Best候选列表的重排序上。

2语音唤醒技术

知音引擎中目前针对固定唤醒词的方式,基于DNN进行端到端的唤醒词建模,具体如下:

图14 端到端语音唤醒流程

这种方法尽管取得了非常低的误唤醒率,但是缺点也很明显,唤醒词无法自定义,因此知音引擎中,我们使用DNN提取Bottleneck Feature,用于基于HMM的唤醒模型训练,较传统基于MFCC的方式也取得了较好的效果。

关于未来

尽管语音识别建模能力取得了较大的提升,但是远场、噪声、口音、发音习惯(吞音)等问题仍然存在,很赞成吴恩达的说法,由95%的准确率发展到99%,尽管只有4%的差距,但是可能会改变人们的交互方式,将实现很少用到经常使用的转变。

目前语音原始数据获取的成本越来越低,工业界正在使用数万小时的已标注数据进行模型更新,将来十万级的训练数据将成为可能,怎么能高效的使用数据,主要有以下几点的考虑:

数据筛选层面:使用无监督、弱监督、半监督的数据进行训练,同时更高效的挑选数据进行标注,知音引擎已经在使用主动学习的方法进行数据的筛选;

运算层面:基于异构计算的集群在超大数据上高效的完成模型训练,而运算能力的升级已经从线下训练扩展到了线上测试;

模型层面:超大数据的学习需要更强能力的模型,目前基于多种模型结构的复合结构(如CNN-LSTM-DNN)已经证明了可行性,后续基于Encoder-Attention-Decoder的序列学习框架也已经在和语音识别进行结合。

同时语音识别尽管现在可以达到很高的准确率,但是准确率从95%到99%甚至100%的这个跨越是由量变到质变的过程,也是决定语音交互能否成为主流交互方式的重要一环,但是目前语音识别的一些老问题仍然存在,技术上仍然没有能力完全解决,因此技术之外的产品创新也很重要,可以有效弥补准确率上的缺失。

以知音引擎为例,它针对这个问题提供了语音纠错的解决方案,针对识别中出现的错误可以使用自然语音的方式进行修正,比如用户想说“我叫陈伟”,识别成了“我叫晨炜”,通过语音说出“耳东陈伟大的伟”就会改正识别结果,目前随着多轮产品的迭代,语音修改已经具备了80%的修改成功率,并且已经应用到了知音引擎的语音交互中,同时在搜狗iOS输入法中也集成了语音修改的能力。

编者注:总结语音识别系统的流程,总结语音识别系统的流程,声学建模和语言建模部分是最关键的一环,而目前基于深度学习的建模技术已经将模型性能提升到新的阶段。不过正如陈伟所说,尽管语音识别的准确率已经达到了较高的水准,但依然有很大的提升空间,那么未来还会出现什么样的模型呢?让我们一起期待人工智能特别是深度学习技术新成果的出现。

Posted in 沐鸣2平台注册 | Tagged | Leave a comment

沐鸣2平台主管_房间太小玩不了 VR?空间压缩技术了解一下

今年已经 2018 年了,虚拟现实(VR)仍没有像我们期待的那样繁荣起来,不过这事儿这也不能全怪 VR 技术不成熟,很多显示原因也得背锅,比如房价。

不管商用还是自用,想要有所谓「走进虚拟世界」的沉浸感和自由体验,房间面积没个上百平基本没戏,在虚拟世界里走两步就出现边界提示,或者干脆一脚踢到墙角,是现在 VR 体验的日常。

虽然像 The Void 这样的 VR 主题公园,可以通过面积巨大的场地在现实世界 1:1 呈现虚拟空间,体验据说棒到炸裂,但前期投入和之后的维护成本也同样高到炸裂,2016 年盛大投资 The Void 的时候就扬言要在中国建 VR 主题公园,然后就没有然后了,或许跟国内地价成本不无关系。

不过,没房有没房的玩法,KAT WALK 之类的原地行走设备应运而生。

或者在 VR 内容设计时妥协,通过「瞬间传送」之类不自然的方式实现虚拟空间中的移动,有的干脆通过场景限制玩家的移动范围。

——结果,我们有了各种大空间位置跟踪技术,但我们没有大空间。 深圳的一家初创公司位形空间(ConfigReality)正试着从算法角度解决这个问题,他们的技术能够让用户在现实空间有限的情况下,于虚拟现实中进行几乎不受限制的自由行走,完全不会感受到物理边界的存在——就像把无限的虚拟空间压缩到了现实中的一间房间之中。

这一技术利用的是人类的认知和运动规律,说白了,就是通过视觉误差欺骗大脑。

人在失去视觉参考物时,是走不了直线的,闭眼原地踏步一分钟,睁开眼往往会发现偏离原始位置一定距离,位置和朝向都会有所偏转。而当 VR 头显完全接管人的视觉时,这种无意识的误差就可以被针对性的引导和利用。

位形空间根据这一规律下的人类认知数据建立了一整套基于视觉的移动引导的系统,通过技术授权和 SDK 的方式输出给内容开发者。

位形空间的事业发展负责人彭俊熙告诉深圳湾,「我们希望通过这样的空间压缩解决方案,给虚拟体验内容的设计者更大的设计自由度。」

「这套算法理论上可以允许设计者使用可用的有限实际空间作为一个空间单元,设计出无限倍大小的虚拟空间,并且每个空间都是体验者可以通过实际行走到达的,而不需要借助额外的移动手段。设计师的限制,不再是实际场地限制,而是转化为故事线、体验时长、世界观这样内容设计层面的问题,更加回归虚拟内容创作的本质。」

据彭俊熙介绍,这一算法主要通过三种方式来引导用户的运动,一是改变转弯角度,即用户转弯时在视角旋转角度和真实旋转角度之间做手脚;二是改变移动距离,即对虚拟和现实中的行进速度进行调整;三是通过细微的视角偏转,将虚拟场景中的直线移动变为现实中的曲线移动。

这套「空间压缩」算法的优化重点主要在数据上,目前的算法可以认为是基于人类认知规律的「常模」,但每个用户在认知上存在个体差异,针对具体用户的使用数据学习之后,算法的表现可以更加自然。在之前一年的研究过程中,位形空间基于自己的算法设计过两个交互场景,开放给数百人体验过并收集反馈数据用于算法改进。此后又为 Vive Focus 一体机定制开发了第三款 Demo 游戏应用。

在 Vive X 的 Demo Day 上,深圳湾实际体验了「空间压缩」算法的实际效果,体验内容是一座室内展览馆,包含多个房间(也就是前文提到的「空间单元」),笔者在其中不停穿梭于各个房间,在将近十分钟的体验过程中都没有感受到物理边界的存在。

不过在移动过程中,还是能感受到明显的视角偏转,移动速度较快时,这些不自然的偏转甚至会导致晕眩。

彭俊熙解释说,这是由于当时体验场地的实际面积实在太小所致导致的。「我们用『转弯半径』来描述用户每移动一个单位长度实际被偏转的角度,这个角度越小,用户的行走体验就越接近真实,但相应需要的转弯半径就越大。所以实际空间越大,用户的体验会越自然。」「空间压缩」算法达到理想效果的最小面积是 4*8 米,这和 HTC Vive 的大空间定位技术 Lighthouse 要求的最小面积基本一致。

位形空间的「空间压缩」算法解决的是 VR 现存的基础问题,如果体验打磨到足够好,在 VR 领域的落地方向几乎是普适性的,「目前我们看到的比较好的匹配领域在于房地产、培训、展览、主题游戏等,只要是有大空间交互需求的,理论上都可以使用我们这套算法。」

深圳位形空间科技有限公司成立于 2017 年 11 月,同月获得 HTC Vive 战略投资,团队为 3 位合伙人,分别拥有建筑学、计算机科学、交互建筑的跨学科背景,核心算法和混合现实解决方案已提交专利与知识产权申请。目前正在寻求天使轮融资。

Posted in 沐鸣2平台注册 | Tagged | Leave a comment

沐鸣2娱乐代理_干货 | 一文带你了解什么是POE有源以太网供电

一个典型的以太网供电系统,在配线柜里保留以太网交换机设备,用一个带电源供电集线器(Midspan HUB)给局域网的双绞线提供电源。在双绞线的末端,该电源用来驱动电话、无线接入点、相机和其他设备。为避免断电,可以选用一个UPS。

可通过网线为无线AP、网路摄像头、网路电话机、掌上电脑等PoE终端设备供电,传送距离可达100m,安装简单,即插即用。非常适合无线城市、安防监控等行业使用。

一、什么是POE

1、POE的由来

2003年6月,IEEE批准了802.3af标准,该标准是基于以太网供电系统POE的新标准,它在IEEE 802.3的基础上增加了通过网线直接供电的相关标准,是现有以太网标准的扩展,也是第一个关于电源分配的国际标准。它明确规定了远程系统中的电力检测和控制事项,并对路由器、交换机和集线器通过以太网电缆向IP电话、安全系统以及无线LAN接入点等设备供电的方式进行了规定。

POE(Power Over Ethernet)是有源以太网供电的简称,指的是在现有的以太网Cat.5布线基础架构不作任何改动的情况下,在为一些基于IP的终端(如IP电话机、无线局域网接入点AP、网络摄像机等)传输数据信号的同时,还能为此类设备提供直流供电的技术。POE技术能在确保现有结构化布线安全的同时保证现有网络的正常运作,最大限度地降低成本。

2、POE供电标准

看要一台PoE交换机能同时给多少摄像头供电,要考虑两个方面:PoE交换机的供电标准和PoE交换机的总供电功率。

PoE交换机的供电功率可以理解为PoE交换机的单端口供电功率。 市场上流行的PoE交换机有两种标准,IEEE802.3af和IEEE802.3at。IEEE802.3af标准定义了供电功率为15.4W,IEEE802.3at标准定义了供电功率可达30W,由于供电标准不同其单端口供电功率也不同。比如摄像头功率为9W,使用af标准的PoE交换机即可;若摄像头功率为20W,需使用at标准的PoE交换机;若摄像头功率为30W以上,就需要使用专用PoE供电模块供电了。

802.3af标准:

供电电压:44-57V

供电电流:10~350mA

最大供电功率:15.4W

最大受电功率:12.95W

802.3at标准:

供电电压:50-57V

供电电流:10~600mA

最大供电功率:30W

最大受电功率:25.5W

一般来说,一个同时支持af和at供电标准的PoE交换机,它的供电功率是自适应的。比如,它连接的是5W的设备,那么提供5W的电力;如果连接的是20W的设备,那么就提供20W的电力。

af和at标准能通用吗?

at是向下兼容af的。也就是说,如果你的交换机支持at标准,最大可供30W电,那他完全可以给支持af标准的需要7W的摄像机供电的。

但是如果摄像机支持at,需要20W的电,只支持af的交换机就无法正常向这个摄像机供电啦。

3、POE的供电过程

1)检测

供电前,供电方会输出一个很小的电压来检测受电设备是否支持PoE,如果不支持,则不供电;如果支持,进行下一步。

2)分类

确定受电方支持PoE后,供电方会进行进一步检测,确定受电方需要的功率,进行对受电方的分类。

3)开始供电

4、POE交换机的总功率

PoE交换机的总功率是一个非常重要的指标,直接关系到可以带多少摄像头。以电源功率是400W的、24端口的PoE交换机来说,除去损耗后PoE交换机总功率大概为370W。

在IEEE802.3af标准下,它能够供满24个端口(370/15.4=24),即可以同时给24个摄像头供电,也就是满载供电。但如果是按照IEEE802.3at标准的单口最大供电功率30W计算,同时最多就只能给12个端口供电了(370/30=12)。

实际使用中,很多普通网络摄像头的最大功耗较低,基本不超过15W,如果这时每个PoE端口按照最大功率(比如30W)去预留供电功率的话,就会出现有的端口PoE功率用不完,而有的端口却分不到功率的情况。比如,有些PoE交换机均支持动态功率分配,可以避免这种情况。在选购PoE交换机时,要看交换机是否支持动态功率分配,这样每个端口只分配实际使用的功率,这样就能更高效地利用PoE交换机的供电功率。

5、POE的技术优势

1)简化布线,节约成本

许多带电设备,例如监控摄像机等都需要安装在难以部署AC电源的地方,POE使其不再需要昂贵电源和安装电源所耗费的时间,节省了费用和时间。

2)便于远程管理

像数据传输一样,POE可以通过使用简单网管协议(SNMP)来监督和控制该设备。这个功能可以提供诸如夜晚关机、远端重启之类的功能。

3)安全可靠

POE供电端设备只会为需要供电的设备供电,只有连接了需要供电的设备,以太网电缆才会有电压存在,因而消除了线路上漏电的风险。用户可以安全地在网络上混用原有设备和POE设备,这些设备能够与现有以太网电缆共存。

6、POE供电稳定吗

从技术角度来讲,PoE的技术发展多年,目前已经处于非常成熟的阶段。但由于目前监控市场迫于成本压力,选用的PoE交换机或者线材品质过于低劣,再或者方案设计本身就不合理,导致采用PoE供电的项目维护的工作量特别大,所以工程商普遍存在PoE供电不稳定的观点。

网络监控项目,不同于普通的网络综合布线,数据传输量非常大,功率高,且要求全天候不间断工作,采用有品质保证的PoE设备和线材是整个系统稳定的保证。

7、POE在安防行业中的应用

得益于POE技术得天独厚的优势,目前安防监控领域已经出现了很多支持POE供电的设备,包括POE网络摄像机、POE网络半球、POE网络球机、POE网络硬盘录像机等。

这些设备拥有POE受电设备端的功能,利用以太网供电的供电端设备(PSE)提供的直流电,通过双绞线传输至受电端(PD)。当然,需要注意的是,POE标准支持最大15.4W,对常见的网络摄像机是足够的。然而,对于可以检测移动物体的动作、转向和进行放大的PTZ摄像机而言,其需要20-30W的电力来正常工作,PTZ摄像机需要具有高达30W的电力输出的POE+新标准的支持。当然,现在已经有许多最新的POE交换机支持POE+标准。

8、POE供电成为安防行业供电主流

在安防领域中,监控作为其中最为重要的部分之一,布线和供电也成为其中必不可少的一部分。传统的监控布线供电一直是业内一个困扰,在IP视频监控的时期,网络基础设施支持是重点,供电也是其中最为关键的一部分。

以往的摄像机都是本地供电,但自推出PoE后,常见的形式是以太网供电IP摄像机。PoE即Power Over Ethernet,是有源以太网供电的简称,指的是在现有的以太网Cat.5布线基础架构不作任何改动的情况下,再为一些基于IP的终端(如IP对讲电话机、WiFi无线局域网接入点AP、网路摄影机等)传输数据信号的同时,还能为此类设备提供直流供电的技术。

PoE是解决供电布线的难题,就目前来说,如果是与基建一起实施的全新监控项目,采用PoE供电仍然比较少,在大型项目中采用PoE供电的也比较少,相反在一些民用、套装的市场,小型项目上,PoE应用非常普遍。

9、PoE供电技术在工程应用中存在哪些风险或劣势?

1)功率不足,受电端带不动:

802.3af标准(PoE)输出功率小于15.4W,对于一般IPC来说足够了,但对于球机等大功率的前端设备而言,输出的功率达不到要求。

2)风险过于集中:

通常来说,一台PoE交换机同时会给多个前端IPC进行供电,交换机的POE供电模块任何故障都会导致所有的摄像机无法工作,风险过于集中。

3)设备、维护成本高:

相对于其他供电方式,PoE供电技术会增加售后维护工作量,从安全稳定的意义上来说,单独供电的稳定性、安全性最好。

10、PoE供电的安全传输距离?网线的选择有哪些建议?

POE供电的安全传输距离100米,建议使用超五类全铜网线。

POE供电网线要求这个问题只在假货便宜货横行的国家是个问题,在很多发达国家不是问题。POE IEEE 802.3af标准要求PSE输出端口的输出功率为15.4W或者15.5W, 传输100米后的PD设备接受功率必须不小于12.95W,按照802.3af典型电流值为350ma计算,100米网线的电阻必须为(15.4-12.95W)/350ma = 7欧姆或者(15.5-12.95)/350ma = 7.29欧姆。

而标准网线是天然就满足这个要求的,IEEE 802.3af poe供电标准本身就是以标准网线测定的。而只所以会产生POE供电网线要求这个问题,是因为市面上的很多网线都是非标准网线,不是严格按照标准网线的要求来生产的。市面的非标准网线材质主要有铜包钢、铜包铝、铜包铁等,这些网线的阻值大,都不适合POE供电。POE供电必须使用无氧铜材质的网线,即标准网线。

PoE供电技术对线材的要求高,建议在监控项目中,千万不要在线材上省成本,得不偿失。

11、如何选择POE交换机

1)需要给多大功耗的设备供电:

PoE交换机采用的标准不同,输出功率也会不同,比如:IEEE802.3af最大不超过15.4W,由于传输线材的损耗,能给最大功耗不超过12.95W的设备供电。遵循IEEE802.3at标准的PoE交换机,能给最大功耗不超过25W的设备供电。

2)最多能给多少个设备供电:

PoE交换机的一个重要指标,就是PoE供电的总功率。在IEEE802.3af标准下,如果一台24口PoE交换机的PoE供电总功率达到了370W,那么就能够供满24个端口(370/15.4=24),但如果是按照IEEE802.3at标准的单口最大供电功率30W计算,同时最多就只能给12个端口供电了(370/30=12)。

3)需要接口数:

是否带光纤口、带不带网管、速率选择(10/100/1000M)。

12、POE交换机可以二级交换吗

PoE只是解决供电问题,不会影响信号的,(一般供电是用的4、5、7、8四根线,而信号是1、2、3、6四根线),如果要使用多层交换机,只需要让离摄像机最近的交换机给摄像机供电就好了,后面的交换机则无需跟PoE有任何关系。

二、POE交换机有哪些工程问题

PoE交换机在无线网络覆盖或无线监控工程中扮演着重要的角色。虽然不像无线AP、网桥等设备这么起眼,但在实际应用的过程中如若出现了问题,也会直接影响到整个无线工程。

为了在施工前就能将些注意事项考虑到位,减少后续工程的维护量,在此给大家罗列出几点PoE交换机常见的工程问题,掌握以下几点,能帮助大家更好的建设与维护无线网络工程:

1、供电距离

大家知道PoE交换机的供电距离一般是100米,其实PoE供电距离是由数据信号和传输距离决定的,数据信号的传输距离是由网线决定的。

1、网线要求

网线的阻抗越低传输距离越远,所以首先要保证网线的质量,购买正品,推荐使用超五类网线,普通的5类线数据信号传输距离大概是100米左右。

由于PoE标准有两种:IEEE802.af和IEEE802.3at标准。它们对超五类网线要求不同,不同主要体现在等效阻抗上。如100米的超五类网线,IEEE802.3at的等效阻抗须小于12.5欧姆,IEEE802.3af则须小于20欧姆。

2、PoE标准

保障PoE交换机的传输距离,就看PoE供电的输出电压,在标准之内(44-57V DC)尽量高,PoE交换机端口输出电压必须符合IEEE802.3af/at标准。

2、选择标准型的POE交换机

如何判断哪些是假的PoE设备?

假PoE设备只是通过一个PoE合路器将DC电源合并到网线中,不能通过标准的PoE交换机来供电,否则设备会烧坏。所以在工程应用中,不仅要选择标准的PoE交换机,还要选择标准的PoE终端 。

标准PoE交换机的安全措施:

1、供电端(PSE)与受电端(PD)可动态感知并调整供电电压。

2、有效保护受电端(通常是IPC)不被电击烧坏(其它方面还有短路、浪涌防护等)。

3、可智能检测终端是否支持PoE,在接入非PoE终端时不会供电。

非标准的PoE交换机通常为了节省成本,并没有以上安全措施。

3、交换机级联问题

交换机级联的层数涉及到带宽的计算,简单举例:

如果采用100M网口交换机级联到中心,有效带宽即45Mbps(带宽利用率≈45%),如果每台交换机分别连接了共15Mbps的监控设备,即占单台交换机带宽15M,则45/15≈3,可级联3台交换机。

带宽利用率为什么约等于45%?

实际以太网IP分组报头约占总流量的25%,实际可利用链路带宽为75%,实际应用中考虑预留带宽30%,所以保险估认带宽利用率为45%。

4、注意交换机的功率

使用设备的功率是多大,再对应选择多大功率的PoE交换机。如果你的设备的功率是在15W以下的,那选择支持802.3af标准的PoE交换机就可以了。如果功率是大于15W的,则需要选择802.3at标准的大功率交换机,否则带不动。当然要您的设备是支持PoE的,不支持PoE则需要准备一个PoE分离器。

5、PoE 技术的机遇与挑战

PoE目前尚面临一些挑战,如PoE技术可让受电设备从每个端口获得30W以上的功率,但不是每个端口的受电设备都需要30W 的功率,因此,如何准确的感测每个受电设备的需要是一个很重要的问题,否则可能对受电设备造成损坏或对网络基础设施形成不安全因素。此外,由于电缆通常被匝成电缆束, 并置于配线柜中,因此线缆束的散热问题则需要考虑。而成本问题则是PoE面临的又一挑战,特别是对PD制造商而言,在产品中加入PoE技术就意味着增加成本。

另外标准的五类网线有四对双绞线,但是在l0MBASE-T和100MBASE-T 中只用到其中的两对。IEEE802.3af允许两种用法,应用空闲脚供电时,4、5脚连接为正极,7、8 脚连接为负极。应用数据脚供电时,将DC 电源加在传输变压器的中点,不影响数据的传输。在这种方式下线对1、2 和线对3、6 可以为任意极性。目前的标准不允许同时应用以上两种情况。电源提供设备PSE 只能提供一种用法,而电源应用设备PD必须能够同时适应多种情况。随着网络监控设备向大功率供电发展的趋势,深圳市光网视科技成功解决并实现了采用四对双绞线全部支持供电,通过提高电源的载流量来增加供电功率,以解决设备对大功率供电的需求。

Posted in 沐鸣2平台注册 | Tagged | Leave a comment

杏耀注册登录网_“奔驰失控”事件真假难辨 汽车定速巡航技术到底是个什么鬼?

就在前几天,汽车圈发生了一件大事,那就是“奔驰的定速巡航失控啦”!3月14日晚间,在河南通往陕西的连霍高速上,一辆奔驰C200L定速巡航突然失控,号称业余赛车手的车主以120公里/小时的速度行驶约1小时,上演了一场“中国版生死时速”。该报道还表示,通过奔驰“后台介入”,最终该车刹车功能恢复,从而得以脱险。

然而,事发至今,该事件中的部分细节同时也遭到了行业内外的多方质疑,具体网上的报道已经铺天盖地。关于此事件我们不作过多讨论,我们今天主要说一说汽车的定速巡航到底是怎么一回事。

汽车巡航控制系统,简称CCS,根据其特点一般又称为“巡航行驶装置”、“速度控制系统”、“自动驾驶系统”等。汽车巡航控制系统(CCS)就是可使汽车工作在发动机有利转速范围内,减轻驾驶员的驾驶操纵劳动强度,提高行驶舒适性的汽车自动行驶装置。汽车在行驶中通过操纵调整开关,驾驶员不必踩踏油门调整车速,汽车也能以设定的车速进行定速行驶。

汽车定速巡航系统主要功能

基本功能

1、车速设定功能

当车辆在高速公路上行驶时,如果路面质量好,没有人流、分道行车,无逆向行车,适宜以较长时间稳定运行时,驾驶员可通过巡航系统设定一个稳定行驶的车速,使其不用控制节气门和换挡,汽车就能一直以这一车速稳定行驶。

2、恢复功能

当司机处理好情况后,根据路面车流情况在判断出又可稳定运行后,可使汽车自动按着上一次设定的车速恒速行驶,驾驶员也可重新设定巡航车速。

3、取消功能

当踩下制动踏板或者按下“取消”键时,则立即退出巡航状态。但是,如果其行驶速度大于最小设定车速,则退出之前设置的速度继续保存,供巡航控制系统随时调用。

4、加速、减速功能

车辆处于巡航行驶状态时,可对设定车速进行加速和减速的操作,从而改变其巡航车速。

故障保险功能

低速自动消除功能

当车速低于低速极限(一般为40km/h)时,巡航控制不起作用,存储的车速消失,并不能再恢复此速度。

关开关消除功能

除了踩制动踏板有消除功能外,当按住车制动开关、离合器控制开关或者变速器挡位开关时,巡航车辆都将自动地消除巡航控制功能。

汽车定速巡航系统优点

提高汽车行驶的稳定性、安全性和舒适性

巡航控制系统保证了汽车无论是在上坡、下坡、平路上行驶,或是在风速变化的情况下行驶,只要在发动机功率允许的范围内,速度都可保持不变。特别是在郊外或者高速公路上行驶时,这种优越性更为显著。由于驾驶员无需踩踏加速踏板,尤其是装有自动变速器的汽车,因不需使用离合器,只需手握方向盘就可轻松驾驶,将驾驶员的右脚解放出来了,大大减轻了驾驶员的疲劳强度,使整个驾驶过程变得简便、轻松和舒适,降低了交通事故发生的几率、提高了行车的安全性。

减少磨损,延长寿命

汽车稳定定速行驶使其额外惯力减少,所以机件磨损减少,使车辆的寿命增加,故障减少。

具有一定的经济性和环保性

在同样的行驶条件下,对于一个有经验的司机来说,在使用巡航控制系统后可以节省15%左右的燃料。这是因为在使用了这一速度稳定器后,可使汽车的燃料供给与发动机功率之间处于最佳的配合状态,减少了CO、CH、NOx等有害气体的排放,有利于环保。

汽车巡航控制系统的组成与工作原理

汽车巡航控制系统由信号输入装置、CCS ECU和执行器等组成,如图所示。

汽车巡航控制系统主要组成部件

操作开关

操作开关用于设置巡航车速或将其重新设置为另一车速,以及取消巡航控制等,包括主开关、控制开关和退出巡航开关。

主开关

主开关(MAIN)是CCS的电源开关,采用按键方式。每次推入,系统电源接通或关闭。

控制开关

手柄式控制开关有5种控制功能,即SET(设置)、COAST(减速)、RES(恢复)、ACC(加速)和CANCEL(取消)。SET和COAST共享一个开关,RES和ACC共享另一个开关。

退出巡航开关

退出巡航开关包括取消开关、停车灯开关、驻车制动开关、离合器开关和空挡启动开关。任一开关接通时,自动取消巡航控制。当CCS取消的瞬间的车速不低于40 km/h时,该车速存储于CCS ECU中。当RES接通时,自动恢复最后存储的车速。

驻车制动开关

当拉起驻车制动操纵杆时,驻车制动开关接通,将取消信号传至CCS ECU。同时驻车制动指示灯亮。

空挡启动开关

当自动变速器换挡杆设置在P挡或N挡时,空挡启动开关接通,将取消信号传至CCS ECU。

离合器开关

当踩下离合器踏板时,离合器开关接通,将取消信号传至CCS ECU。

停车灯开关

由两个开关组成。踩下制动踏板时,两个开关同时工作。开关A闭合,电流经其流过停车灯开关,使停车灯亮。同时,蓄电池电压经过停车灯开关施加在CCS ECU上,使其判断制动器处于工作状态,ECU取消CCS工作,开关B断开,执行器得不到CCS ECU的信号,停止工作。

传感器

VSS:VSS提供一个与汽车实际车速成比例的交变振荡脉冲信号,CCS ECU将此信号进行处理,计算得出当前车速。

TPS:TPS对CCS ECU提供一个与节气门位置成正比的电信号。

节气门控制摇臂传感器:节气门控制摇臂传感器对CCS ECU提供节气门控制摇臂位置信号,目前采用较多的是滑线电位计式,当节气门控制摇臂转动时,电位计随之转动,便输出一个与控制摇臂位置成正比例且连续变化的电信号。

CCS ECU

CCS ECU由处理器芯片、A/D、D/A、IC及输出重置驱动和保护电路等模块组成,ECU接收来自车速传感器和各种开关的信号,按照存储的程序进行处理,当车速偏离设定的巡航车速时,对执行器发出控制信号,控制执行器工作,使实际车速与设定车速相一致。CCS ECU的组成如图所示。

汽车巡航控制系统工作原理

汽车巡航系统是一个典型的闭环负反馈控制系统,其原理如图所示。

CCS ECU的信号有2个,一是驾驶员根据行驶条件,通过巡航开关设定的巡航车速信号;二是车速传感器输入的实际车速反馈信号。当巡航设定车速信号和实际车速反馈信号输入CCS ECU后,CCS ECU经过比较运算可得速度偏差变化E和偏差变化率EC,经过处理后,再结合当前节气门的开度信号,可得到控制节气门开度大小的控制信号,CCS ECU将控制指令发送给执行机构,执行机构就可驱动节气门拉索调节发动机节气门开度的大小,将实际车速迅速调节到驾驶员设定的车速值,从而实现恒速控制。

汽车定速巡航系统的使用条件

1、原则上定速巡航要在高速公路或全封闭路上使用。 因为在非封闭路上,复杂的路况不利于交通安全。

2、雨天禁用,雪冰天禁用。

3、盘山路或弯路过多,要禁用。因为我们在正常出弯路的情况下,要适当加油提供更大的转向力。定速巡航状态下车辆自动维持车速恒定,油门由行车电脑控制,往往给弯路行车带来危险。如果在这种条件下,应当适当控制车速。

4、道路上车辆太多,也不适合定速巡航。

其他类型的汽车巡航控制技术

限速巡航技术

限速巡航与定速巡航非常相似,最大的区别是设定限速后,若要保持设定速度脚不能离开油门踏板,只要达到设定速度,电脑会自动判断此时所需供油量,除非将油门快速深踩,否则油门的轻微增加不会有任何影响。换句话说,油门变成了限速开关的保险,只有踩着油门才能实现与定速巡航同样的效果。最大特点:脚不离开踏板,遇到紧急突发情况,反应时间会更短一些;由于油门依然可控,在上下坡较多的路段,会比较低级的“人工智能”人性化很多。

电子限速的作用是限制车速过高,防止因车速过高造成事故。电子限速器可以实时监测车辆的速度,当车速达到一定值的时候,它就会控制供油系统和发动机的转速,这时即使踏下油门踏板,供油系统也不会供油。

电子限速器的临界值在车辆出厂时已经设置好,一般是无法改变的。在国外,汽车的最高时速一般被限制在250km,而在国内,因为大部分国产车辆的最高时速只是200km多一点,很多都达不到200km,所以一般都没有电子限速器。电子限速器的应用,可以在很大程度上降低交通事故的发生率,减少人员伤亡及财产损失。

主动巡航技术

主动式巡航控制系统能够连续调整车速以保持与前车的安全距离。配有巡航控制系统的车辆通常在发动机舱内配有巡航控制模块,通过控制执行器调节节气门来控制车速。

在方向盘附近通常有加、减、设定等按键,还有一个控制键是制动踏板,如果是手动变速器,离合器踏板也可以起到关闭巡航的功能。作为安全特性,只要你一踩制动踏板,巡航就会自动取消,在40km/h以下的车速时不能设定巡航。

在取消设定后,如果你再按设定键就会再次启动巡航。假定你现在的车速是45km/h,按下设定键后车速就会保持在45km/h。再按下加速键,车速就会以一定的数值提升。巡航控制系统不仅具有控制车速的功能,还能通过控制键以1km/h的定值加速或减速。

主动巡航最大的特点加入了雷达或红外线探测器,并且赋予巡航“人工智能”,它能帮助驾驶员在大雾、沙尘等天气下保证更高的安全性,并且能完成高级驾驶员所具备的跟车能力。虽然还不能完全取代人的作用,但在情急时刻能为你预留出更多的处理时间,或帮你在第一时间做出正确反应。

ACC自动巡航技术

欧洲的汽车制造商在90年代末已完成将雷达传感器用于ACC自动巡航系统的第一步,该装置将FMCW雷达传感器和ACC控制器集成为一体。这种实现车辆纵向车速控制的系统叫做智能巡航系统(ACIC/ICC)或称作自动巡航控制(ACC)。

ACC采用了一个距离传感器来测量前进车速,这个距离传感器就是一个雷达传感器。多个雷达传感器组成一个空间传感器。前方没有车辆时,ACC系统和老式的巡航控制系统工作情况一样,但当感应到前方有较低车速的车辆时,ACC系统可自动地控制巡航车速与前方车辆保持安全距离,一旦前方车辆消失,ACC系统马上又将车速加速到司机设定的车速,这就完成了所谓智能巡航的功能,使汽车真正作到安全舒适、操作简便。ACC系统作为原车身电脑的一个部件,在原ECU上再增加一个ECU,该ECU包括ACC的传感器及控制器,也可称作SCU。

SCU装在汽车前部,由雷达传感器组成的空间传感器检测周围物体的行驶状态,然后将数据通过数据总线再传到ECU,车内人机对话界面包括操作开关、信息显示和制动踏板及加速踏板。ACC系统中的执行单元由ECU控制,比如发动机控制、变速箱控制和制动踏板的控制。

主动巡航控制类似于传统的巡航控制,同样是保持设定的车速,不同的是新系统能够自动调节车速以保证与前车有足够的安全距离。系统包括雷达传感器、数字信号处理器和控制模块。司机设定所希望的车速,系统利用低功率雷达或红外线光束得到前车的确切位置,如果发现前车减速或监测到新目标,系统就会发送执行信号给发动机或制动系统来降低车速。当前方道路没车时又会加速恢复到设定的车速,系统会自动监测下一个目标。

ACC巡航控制系统性能好坏的关键在于雷达的性能,雷达的功用是测知相对车距、相对车速、相对方位角等信息,其性能的优劣直接关系到 ACC 系统性能的好坏。当前应用到 ACC 系统上的雷达主要有单脉冲雷达、毫米波雷达、激光雷达以及红外探测雷达等。单脉冲雷达和毫米波雷达是全天候雷达, 可以适用各种天气情况, 具有探测距离远、探测角度范围大、跟踪目标多等优点。

激光雷达对工作环境的要求较高, 对天气变化比较敏感, 在雨雪天、风沙天等恶劣天气探测效果不理想, 探测范围有限, 跟踪目标较少, 但其最大的优点在于探测精度比较高且价格低。红外线探测在恶劣天气条件下性能不稳定, 探测距离较短, 但价格便宜。

Posted in 沐鸣2平台注册 | Tagged | Leave a comment