Research Topic
社交机器人是一种活跃在网络媒体和平台中的软件机器人,能够利用计算机算法自动化完成筛选、阅读、发布/转发、评论、点赞等信息生产和消费行为。 传统上,社交机器人被认为是一种负面技术,包括:传播暴力、虚假和恶意等负面信息,限制自由意见交流等。 然而,社交机器人也能够成为智能媒体时代的创新研究和应用工具。
研究组围绕社交机器人相关技术,开展传播学相关理论和应用研究,同时,也致力于提供面向社交机器人实验研究的相关工具集(Crowbar)和数据集。
目前主要的研究主题包括:
- 互联网媒体传播效果评价
- 推荐算法黑箱监测与分析
- 智能社交媒体田野实验方法
- 信息茧房/过滤气泡机制研究
- 人机交互理论与实验分析
2024年,计划在北京师范大学(珠海校区)招收”计算传播学“方向博士研究生1名,要求:
- (1)满足北京师范大学新闻传播学院报名基本要求;
- (2)具备一定的大数据分析技术能力;
- (3)有国内外学术论文发表经验优先;
- (4)工作认真细致,能够有效交流沟通;
欢迎有意向同学联系。
Recent Publication
- Long, J. et al. Social Media Opinion Analysis Model Based on Fusion of Text and Structural Features. Appl. Sci. 13, 7221 (2023).
- 刘茜, 刘清渭, 闵勇 & 吴晔. AI赋能与人机耦合:AIGC时代的社交机器人. 传媒 23–25 (2023).
- 闵勇 & 黎樟浩. 被高估的新闻回避:受众新闻阅读行为的研究. 青年记者 23–26 (2023).
- 刘茜, 汤清扬, 闵勇, 傅晨波 & 赵芸伟. 新闻推荐必然导致“茧房”效应吗?——基于模拟新闻平台的实验研究. 新闻大学 28-43+118 (2023).
- Li, Z., Zhang, J., Xuan, Q., Qiu, X. & Min, Y. A novel method detecting controversial interaction in the multiplex social comment network. Front. Phys. 10, (2023).
- Fu, C. et al. Feature Drift in Fake News Detection: An Interpretable Analysis. Appl. Sci. 13, 592 (2023).
- 李明杰 et al. 新冠疫情下的国际科研合作研究. 电子科技大学学报 51, 928–936 (2022).
- 傅晨波 et al. 基于超图嵌入和有限注意力的社会化推荐. 小型微型计算机系统 1–10 (2022).
- Fu, C., Yue, X., Shen, B., Yu, S. & Min, Y. Patterns of interest change in stack overflow. Sci. Rep. 12, 11466 (2022).
- 傅晨波, 夏镒楠, 岳昕晨, 俞山青 & 闵勇. 一种融合信息网络结构的数据增强行为预测算法. 小型微型计算机系统 43, 568–573 (2022).
- Han, H. et al. SSLE: A framework for evaluating the “Filter Bubble” effect on the news aggregator and recommenders. World Wide Web 25, 1169–1195 (2022).
- 闵勇, 周钰颖, 邵安 & 吴晔. 海外网络用户对新冠疫情态度和情感的大数据分析——基于Facebook平台新闻内容和用户点赞行为的分析. 史量才传播学刊 2020, 105–123 (2022).
- Min, Y. et al. The role of degree correlation in shaping filter bubbles in social networks. Physica A 584, 126366 (2021).
- Fu, C. et al. A Novel Spatiotemporal Behavior-Enabled Random Walk Strategy on Online Social Platforms. IEEE Trans. Comput. Soc. Syst. 9, 807–817 (2021).
- 周钰颖 et al. 社交媒体机器人的研究现状、挑战与展望. 小型微型计算机系统 1–11 (2021).
- 王飞程, 周钰颖 & 闵勇. 多层网络链路预测研究进展. 计算机应用与软件 38, 10–20 (2021).
- 金诚 et al. 在线社交网络控制实验的现状与展望. 浙江大学学报(理学版) 47, 1–11 (2020).
- Min, Y., Jiang, T., Jin, C., Li, Q. & Jin, X. Endogenetic structure of filter bubble in social networks. Roy. Soc. Open Sci. 6, 190868 (2019).
- 王卫红, 梁朝凯 & 闵勇. 基于可视块的多记录型复杂网页信息提取算法. 计算机科学 46, 63–70 (2019).
- Jin, C. et al. Group-based rewiring rules of binary opinion competition dynamics. Sci. Rep. 8, 14423 (2018).
- Min, Y., Du, Y. & Jin, C. The effect of link rewiring on a coevolutionary common pool resource game. Physica A 512, 935–944 (2018).
- Du, Y. et al. A global strategy to mitigate the environmental impact of China’s ruminant consumption boom. Nat. Commun. 9, 4133 (2018).
- Jiang, J., Min, Y., Chang, J. & Ge, Y. Biological interactions and cooperative management of multiple species. PLoS One 12, e0180189 (2017).
- Jin, X., Jin, C., Huang, J. & Min, Y. Coupling effect of nodes popularity and similarity on social network persistence. Sci. Rep. 7, 42956 (2017).
- Wang, W., Chen, M., Min, Y. & Jin, X. Structural diversity effects of multilayer networks on the threshold of interacting epidemics. Physica A 443, 254–262 (2016).
- Yang, G. et al. Using ecosystem service bundles to detect trade-offs and synergies across urban–rural complexes. Landsc Urban Plan 136, 110–121 (2015).
- Min, Y. et al. Diversity of multilayer networks and its impact on collaborating epidemics. Phys. Rev. E 90, 062803 (2014).
Free Software
我们将提供一系列与社交机器人开发、运行、部署和监控相关的软件系统。
Dataset
数据资源可供科研合作,请联系本人获取资源。序号 | 数据集名称 | 数据源平台 | 文件大小 | 规模 | 时间范围 | 数据获取方式 | 采集采购人员 | 说明 |
---|---|---|---|---|---|---|---|---|
1 | 新闻+评论数据集 | 今日头条 | 448GB | 用户12,805,244;新闻3,537,930;评论60,351,733 | 2017-03至2020-11 | 自主采集 | 闵勇,卫宁,龙杰 | 实际数据主要从2019年开始,联系8~12个月 |
新浪新闻 | 用户10,533,283;新闻1,650,663;评论33,734,799 | 2016-09至2020-06 | ||||||
网易新闻 | 用户702,666;新闻120,025;评论9,703,218 | 2015-06至2020-03 | ||||||
2 | 新闻全文分类数据集 | Google News(US) | 80.2GB(压缩) | 1,588,168 | 2021-07至2023-09 | 自主采集 | 闵勇 | 每日持续采集,存在部分原文缺失 |
Google News(CN) | 54,058 | 2023-05至2023-09 | ||||||
Google News(TW) | 74,917 | 2023-05至2023-09 | ||||||
Google News(HK) | 48,951 | 2023-05至2023-09 | ||||||
HuffPost | 5,419 | 2023-05至2023-09 | ||||||
3 | Reddit全平台数据集 | 1.78TB(压缩) | 全站完整数据 | 2005-06至2022-08 | 平台限时开放 | 闵勇 | ||
4 | 新闻推荐MIND数据集 | 微软新闻 | 1.23GB(压缩) | 用户1,000,000;新闻161,013;点击记录24,155,470 | 2019-10至2019-11 | 公开数据集 | 闵勇 | |
5 | 封面浏览记录样本数据集 | 封面新闻 | 14.5GB | 41,011,683 | 2019-07至2019-12 | 平台合作提供 | 吴晔 | |
6 | 微博评论数据集 | 新浪微博 | 2.81TB(压缩) | ≈20,000,000,000 | 2022-01至2023-05 | 公司采购 | 黎樟浩 | |
7 | 人民日报正文数据集 | 人民日报 | 3.46GB | 1,067,199 | 2000-01至2022-05 | 第三方合作提供 | 吴晔 | |
8 | 问答数据 | 知乎 | 150G+31M | 问题1,500,000和相应回答;用户200,000 | 自主采集 | 张伦,闵勇 | ||
638M | 问题10,000和相应回答 | 张伦 | ||||||
9 | StackOverflow | 126G | 问题22,306,171和相应回答 | 2008-07至2022-03 | 公开数据集 |
Course
*** 2023 自然语言处理 @ BNU
介绍自然语言处理的基本知识和应用方法。
- 01:自然语言处理介绍 pptx
- 02:文本预处理 pptx
- 03:文本向量表达 gate.io app
- 04:Word2Vec pptx
- 05:文本相似性 pptx
- 06:Topic Modeling pptx
- 07:LSTM pptx
- 08:RNN+Attention pptx
- 09:Attention pptx
- 10:情感计算 MAHA168
大作业:针对软硬新闻分类任务,利用给定的MIND和Google新闻数据集进行文本分类器设计和训练,并在给定的测试数据集(由教师保存)上进行评测。
- 规则说明:规则(docx)
- 数据:Microsoft MIND数据集(tsv)和Google News数据集(tsv)
- 分类标准:硬软新闻判别标准(xlsx)
- 测试样本和输出:测试输入样本(txt)和测试输出样本(txt)
*** 2023 全媒介素养 @ BNU
从交叉学科角度,重点介绍当今智能互联网媒体的特点、问题、使用技巧和主要议题及问题。
- 01:网络媒体简介 pdf
- 02:网络科学 pdf
- 03:信息极化 pdf
- 04:假新闻 gate io login
- 05:推荐系统 pdf
- 06:人工智能 pdf
- 07:计算思维 pdf
- 08:意见冲突 pdf
- 09:刻板印象 pdf
- 10:社交机器人 pdf
大作业:仿照library.ship.edu,在中文互联网环境中,总结一个话题(topic)的主要内容。必做项为话题简介和关键词,可拓展总结该话题的背景、参考文章或书籍、数据库、相关研究机构等。
对于话题(topic)的要求:
- 长期性:包括怎么变化、发展(话题要与短期事件区分开;如中美冲突)
- 冲突性:话题并非存在绝对对错,需要有支持者和反对者
- 自由性:在网络上不那么容易被删帖,能够被讨论的
- 明确性:能与别的主题区分开,有一定关键词
- 热门性:要有人参与、能从中获得一定的信息
作业提交模板:Template