更改

大数据智能-Lucida使用

删除10字节2016年12月8日 (四) 13:00
==图像匹配IMM==
 
===概述===
所谓图像匹配,就是给定一张图片,并在一个图片集中寻找与这张图片最相似的图片。
==问答QA==
<big>1.===Lucida demo QA使用介绍</big>===
(1)用户自定义信息类
例:
*谁是中国的最后一位皇帝?*谁发现了南极点?*谁发明了电话?*哪位希腊数学发发展了几何学?*慕尼黑协定在何时签订?*泰森在何时夺冠*尼罗河位于什么地方?
<big>2.===依赖项介绍</big>===
(1)OpenEphyra:OpenEphyra 是一个使用 Java 开发的模块化、可扩展的开源问答系统。它从网络和其他资源检索自然语言问题的答案。开发者能基于这项项目开发新的问答系统,而不用关心端到端系统。
(4)Apache Thrift:提供标量化跨语言开发服务。由一个软件栈和代码生成引擎组成,提供在C++, Java, Python, PHP, Ruby等多种语言间无缝高效转换的服务。
<big>3.===代码结构</big>===
(1)文件结构
*main:主函数目录
**QADaemon.java:主函数,启动QA服务,监听客户端请求
*handler:处理Lucida服务的代码目录
**KnowledgeBase.java:知识库类(KnowledgeBase)
**QAServiceHandler.java:远程调用框架Thrift文件中的QA服务接口(QAServiceHandler)
以上就是该项目程序的主要部分。
===原理分析===
===功能实现示例===
 
*训练集(From Bing Picture)
 
 
[[文件:Face-training.jpg|1000px]]
 
*测试集(From Bing Picture)
[[文件:9-Hillary.jpg|300px]]
[[文件:9-Hillary.jpg|300px]]
*效果
 
[[文件:FACE-input.PNG|500px]]
}
[[File:FACE-struct.png]]
 
====FACE服务器搭建====
FACEServer.cpp
===Lucida中的实现方式===
我们发现,在Lucida中,ASR的任务完全交给了Kaldi GStreamer server来实现。
 
====GStreamer====
GStreamer 是一个开源的多媒体框架库。利用它,可以构建一系列的媒体处理模块,包括从简单的 ogg 播放功能到复杂的音频(混音)和视频(非线性编辑)的处理。
在这里,Kaldi的语音识别模型被视为GStreamer的一个插件。
 
====Master Server====
主服务器负责接收客户端的识别请求,为每一个请求分配一个Worker,Worker负责学习和识别的过程。
 
====Client====
用户可以调用给定的client程序,以指定的速率发送音频文件到服务器的监听端口,正常情况下会返回识别结果。
也可以使用提供的简单的HTTP API来发送和接收音频文件和识别结果。
117
个编辑