
主题一:基于背景抑制与上下文感知的
人群计数算法
主讲:黄奕秋
(导师:胡晓)
主题二:无监督鸟鸣音节聚类方法研究
主讲:吴科毅
(导师:陈庆春)
主办机构
足球竞猜平台-专业推荐与精准预测
时间安排
2022年12月20日下午16:00-17:30
地点
腾讯会议ID:466-494-247
为拓宽研究生学术视野,促进研究生学术交流,营造良好的学术氛围,足球竞猜平台
主办的“研途青年说”第28讲于12月20日下午16:00-17:30在线上(腾讯会议ID:466-494-247)举行。本次主讲人为20级研究生吴科毅和黄奕秋,主题分别为无监督鸟鸣音节聚类方法研究和基于背景抑制与上下文感知的人群计数算法。
第一个汇报的是吴科毅同学,他从选题背景及意义、现状与研究目标、研究方法及过程、关键技术与实践难点、研究结果与应用、论文总结六个方面展开了介绍。他首先介绍了鸟类发音研究在鸟类识别与鸟类行为研究中的应用,然后简单概括了已有研究方法中,包括有监督音节标注方法和无监督聚类方法。接着,他讲解了研究方法:拾音器终端采集声音,经音节提取算法定位和提取每个鸟鸣音节,经过表征学习与狄利克雷过程混合模型交替学习得到音节分类器。研究过程中涉及的关键技术与实践难点有:准确的音节切分、让模型学习到嵌入特征、音节数量自动推、排除干扰样本。为了解决上述难点,研究过程中采用了了一种多音节分割算法,利用变分编码器表征学习,同时还采用了基于迪利克雷混合模型的自动音节种类推断方法。最后的研究结果显示,在不需要人工标注数据与音节边界划分的情况下,研究过程中所提出的无监督方法能获得接近人工标注数据的有监督方法,为自动鸟鸣音节处理提供了一种可靠的、自动的分析方法。

第二个汇报的是黄奕秋同学,他首先介绍了研究的背景和意义:通过视觉算法准确估计视频或图像中的人数和人群空间密度分布,并且根据人群分布情况, 自动处理分析视频数据和进行实时预警,提高信息的处理效率,推动预警方案的快速决策。然后他讲解了目前一些相关的研究方法的主要特点和存在的缺陷,随之指出研究过程中的主要挑战为图像中人群图像透视畸变、背景噪声识别等问题会对模型的检测和识别产生严重干扰。接着,他介绍了研究内容,主要有三部分:一是背景噪声抑制;二是上下文感知增强,三是动态感知。最后的实验结果展示了公开数据集上不同算法的MAE与MSE结果比较,肯定了所提算法的可行性。

研途青年说学生简介

黄奕秋
2020级足球竞猜平台
电子与通信工程专业硕士
导师:胡晓
主要研究方向:机器视觉、人群计数算法
主要科研成果:北大核心论文一篇

吴科毅
2020级足球竞猜平台
通信与信息系统专业学术硕士
导师:陈庆春
主要研究方向:鸟声音节序列分析
主要科研成果:中文核心与在投SCI各一篇