2018年7月20日第一天

成功安装Android Studio及其Android SDK，并将GitLab上的androidAudioRecg[1] 项目下载并安装到提供的Android平板上。
以自己为声源，对androidAudioRecg项目所需的训练集进行了扩充
初步了解了PYNQ的使用方法，尝试编写了一个LED灯计数的程序并进行了烧写

2018年7月23日第二天

进一步熟悉了对PYNQ的操作，通过外界模块实现了对光强的测量
初步接触opencv，将样例程序烧写至PYNQ，实现了对图像的捕捉和人脸检测

面部识别图

安装opencv和python-opencv，并简单地进行了图像识别的尝试

以开源图片训练集[2]中的100张犀鸟图片作为正样本，[3]中截取的300图片作为负样本

使用opencv自带的opencv_createsamples命令和opencv_traincascade（opencv_haartraining未成功使用）命令，具体参数为：
opencv_createsamples: -num 100 -w 60 -h 60
opencv_traincascade: -numPos 40 -numNeg 600 -numStages 5 -w 60 -h 60 -minHitRate 0.98 -maxFalseAlarmRate 0.5 -weightTrimRate 0.95 -maxDepth 1 -mode ALL

尝试中发现正样本图像的规格达到150*150像素时，训练过程无法正常进行（磁盘迅速被占用），故最后使用100张60*60像素的正样本，并参考网上建议使用了300张负样本。实际上训练过程中-numPos参数仍然过大，使得训练两级后正样本即使用完毕，训练结果并不理想。

训练测试结果如下，可见其可以在某些情况下实现对“鸟类”（而非犀鸟）的识别，但仍会出现极大误差（甚至无法识别犀鸟）。

鸟类识别图1-啄木鸟

鸟类识别图2-犀鸟

鸟类识别图3-飞机

最后修改于2018年7月23日 (星期一) 16:28

柳子澍

2018年7月20日第一天

2018年7月23日第二天

iCenter Wiki

柳子澍

2018年7月20日 第一天

2018年7月23日 第二天

iCenter Wiki

2018年7月20日第一天

2018年7月23日第二天