更改 - iCenter Wiki

大数据智能-Lucida使用

删除10字节、2016年12月8日 (四) 13:00

==图像匹配IMM==

===概述===

所谓图像匹配，就是给定一张图片，并在一个图片集中寻找与这张图片最相似的图片。

==问答QA==

~~<big>1.~~===Lucida demo QA使用介绍~~</big>~~===

（1）用户自定义信息类

例：

*谁是中国的最后一位皇帝?*谁发现了南极点?*谁发明了电话?*哪位希腊数学发发展了几何学？*慕尼黑协定在何时签订?*泰森在何时夺冠*尼罗河位于什么地方？

~~<big>2.~~===依赖项介绍~~</big>~~===

（1）OpenEphyra：OpenEphyra 是一个使用 Java 开发的模块化、可扩展的开源问答系统。它从网络和其他资源检索自然语言问题的答案。开发者能基于这项项目开发新的问答系统，而不用关心端到端系统。

（4）Apache Thrift：提供标量化跨语言开发服务。由一个软件栈和代码生成引擎组成，提供在C++, Java, Python, PHP, Ruby等多种语言间无缝高效转换的服务。

~~<big>3.~~===代码结构~~</big>~~===

（1）文件结构

*main：主函数目录

**QADaemon.java：主函数，启动QA服务，监听客户端请求

*handler：处理Lucida服务的代码目录

**KnowledgeBase.java：知识库类(KnowledgeBase)

**QAServiceHandler.java：远程调用框架Thrift文件中的QA服务接口(QAServiceHandler)

以上就是该项目程序的主要部分。

===原理分析===

===功能实现示例===

*训练集（From Bing Picture）

[[文件:Face-training.jpg|1000px]]

*测试集（From Bing Picture）

~~[[文件:9-Hillary.jpg|300px]]~~

[[文件:9-Hillary.jpg|300px]]

*效果

[[文件:FACE-input.PNG|500px]]

→

}

[[File:FACE-struct.png]]

====FACE服务器搭建====

FACEServer.cpp

===Lucida中的实现方式===

我们发现，在Lucida中，ASR的任务完全交给了Kaldi GStreamer server来实现。

====GStreamer====

GStreamer 是一个开源的多媒体框架库。利用它，可以构建一系列的媒体处理模块，包括从简单的 ogg 播放功能到复杂的音频（混音）和视频（非线性编辑）的处理。

在这里，Kaldi的语音识别模型被视为GStreamer的一个插件。

====Master Server====

主服务器负责接收客户端的识别请求，为每一个请求分配一个Worker，Worker负责学习和识别的过程。

====Client====

用户可以调用给定的client程序，以指定的速率发送音频文件到服务器的监听端口，正常情况下会返回识别结果。

也可以使用提供的简单的HTTP API来发送和接收音频文件和识别结果。

117

个编辑