【Python招聘】_杭州势然网络科技有限公司招聘-程序员客栈

Python-远程-1个月

￥6-12K/月

技能要求: HTML5

经验要求: 5-10年经验

程序员客栈

2025-04-28 10:40

工作描述:

项目编号：【173453】
基于人工智能的多模态舆情监测系统需求文档
版本：1.0
日期：2025年4月8日

一、系统概述
本系统旨在利用人工智能技术，实现对抖音、小红书、微博、黑猫投诉平台等主流社交媒体的多模态舆情信息（文本、图像、视频、音频）的实时监测、深度分析及智能预警，为企业和机构提供舆情风险识别、动态追踪和危机应对支持。

二、核心功能需求
1. 多平台实时监测模块
1.1 数据采集范围
覆盖平台：抖音（短视频及评论）、小红书（图文笔记及评论区）、微博（博文及转发链）、黑猫投诉平台（投诉内容及回复）。
数据形式：支持文本、图像（含OCR识别）、视频（关键帧提取及语音转文字）、音频（情感语调分析）的采集。
1.2 关键词触发监测
自定义关键词库：允许用户设置多组关键词（如品牌名、产品型号、高管姓名等），并支持正则表达式匹配和同义词扩展（如“故障”可关联“问题”“缺陷”）。
动态扩展机制：根据舆情热点自动补充相关关键词（如突发事件的衍生话题）。
1.3 实时数据抓取
快速响应：通过分布式爬虫和平台API接口，实现新内容发布后10秒内抓取入库。

2. 多模态数据分析模块
2.1 多模态特征提取
文本分析：
o情感识别：基于深度学习模型（如DeepSeek大模型）判断情感倾向（正面/负面/中性），准确率≥98%。
o主题聚类：通过LDA算法提取话题标签（如“产品质量”“服务投诉”），并生成热度指数。
图像/视频分析：
o视觉内容识别：通过ResNet-50模型检测敏感图像（如示威标语、产品缺陷图），支持像素级定位。
oOCR与场景理解：提取图像中的文字信息，并与上下文关联（如“包装破损”配图）。
音频处理：
o语音情感分析：识别语音中的情绪波动（如愤怒、焦虑），用于视频评论的深层情绪判定。
2.2 传播影响力评估
传播路径追踪：构建转发/评论网络图谱，识别关键节点（如KOL、高转发账号）。
爆发力指标：计算单位时间内的转发量、评论量增长率，动态阈值触发预警（如1小时内评论量增长500%）。

3. 智能预警与响应模块
3.1 预警触发条件
复合型规则引擎：
o基础规则：单一事件转发量>10万次或负面情感占比>30%。
o动态规则：基于历史数据训练的LSTM模型预测传播趋势，提前1-2小时预警潜在危机。

三、系统性能要求
1.实时性：从数据采集到预警推送延迟≤30秒，支持每秒处理10万条并发数据。
2.准确性：舆情分类准确率≥95%，误报率≤2%。
3.扩展性：支持横向扩展至50个监测平台，存储容量按需动态分配。

四、技术实现方案
1.架构设计：
o前端：可视化仪表盘（支持热力地图、传播链路图）。
o后端：微服务架构，采用Kafka实现数据流实时处理，Redis缓存高频数据。
2.AI模型选型：
o多模态融合模型：CLIP架构统一文本与图像特征，Whisper处理音频转译。
o垂直领域优化：基于行业数据（如金融、医疗）微调模型，提升专业场景识别能力。

五、交付与运维
1.源码交付：提供全量源代码和数据库文件
2.本地化部署：提供本体化部署服务支持

六、参考系统
归一智能：通过情绪分析和传播推演，为比亚迪汉二代车型发布会提前识别用户期待点。
梅花数据：利用DeepSeek大模型实现多语言舆情毫秒级翻译，预警准确率提升至98%。

公司信息

程序员客栈

立即沟通