职位

职业角色

全部

后端

移动端

前端

DBA

设计师

产品经理

高端技术职位

更多

全部

人工智能

国内地区

全部

北京

上海

深圳

杭州

广州

成都

南京

更多

工作方式

全部

兼职

驻场

人工智能
¥18-30K/月

Caffe

5-10年经验

1个月

项目编号:【175859】 一、需求 这款APP目的是探索智能手机应用在引导敏感人们规避有害空气污染暴露的可行性。 1.通过图像分析为用户呈现PM2.5暴露信息 该功能分为两个内容: (1)根据用户所拍摄图像,为用户估算其所在位置的PM2.5浓度。对于部分(1)的实现,委托方会提供一个算法:该算法包括一套从图像中提取相关特征的计算算法,以及一个基于XGboost的模型权重文件,用以实时根据图像估测PM2.5浓度。该算法将会计算返回一个PM2.5浓度估计值,显示在用户界面上。 (2)对用户所拍摄的图像进行视觉分析,获取关于周边环境PM2.5浓度的一些环境相关信息(如场所的类型,图像中的机动车、路面、树木等)。并在照片进行标注,并且根据用户所处的场所类型进行提示,在图片中标注处机动车和路面排放大气污染物、树木吸附大气污染物的情景。 内容(2)可以进一步分为子模块①与②。对于内容(2)的两个子模块的实现,委托方目前提出了多种方案: ①识别用户所在的场所。第一个方案是使用在places365数据集上训练的模型来直接对用户当前所处的场所来做出判别。Places365是大规模的场景识别数据集,在该数据集上训练的模型拥有根据图像判断用户所处场所的能力。APP可以根据判断结果做一些提示,譬如:胡同/小巷——通风和卫生条件可能较差,建议注意防护;商业街——人群密集,建议注意防护,等等。模型的下载地址在https://github.com/CSAILVision/places365?tab=readme-ov-file。需要注意的一点是,对于模型输出结果,需要进行后处理。譬如,在places365上训练的模型能够细分出非常多的场景类型,但许多场景类型,如售票处、跑马场,是与PM2.5完全无关的。委托方只需要在识别出与PM2.5可能有关的场景类型(如工地、街道、商业区等)时给出提示即可。因此,如果采用第一个方案,则制作方需要帮助委托方将现成的开源模型部署在APP中,并且对APP输出进行后处理。 第二个方案是使用国内外主流互联网企业提供的API服务(如百度的图像识别API、腾讯的图像标签API)。如华为、科大讯飞提供的图像识别API,似乎能够判断出用户所在的场景类型,从而实现①的功能。如果选择第二个方案,则制作方需要帮助委托方在APP中调用API,并且同样对API输出进行后处理。 ②标注出照片中与PM2.5浓度相关的要素(包括机动车、路面、植被、工地、吸烟者等等)。目前来说,第一个实现方案同样是使用国内外主流互联网企业提供的API服务(如百度的图像识别API、腾讯的图像标签API等。据我了解,https://aistore.stonedt.com/media/tag/all这家挺不错)。这些API往往有较强的图像识别能力,比如说:可以识别新能源和非新能源车牌、识别与PM2.5有关的行为要素(抽烟)等。当然,对于API输出结果需要进行后处理。譬如,通用的图像标签功能可能会将照片中的所有物体,如桌椅板凳全部标注出来,但是委托方只需要标注图像中与PM2.5有关的要素(如植被、车辆等)即可。如果选择第一个方案,则制作方需要帮助委托方在APP中调用API,并且同样对API输出进行后处理。 第二个实现方案是委托方寻找开源的语义分割/目标检测模型。如果采用第二个方案,则制作方需要帮助委托方将现成的开源模型部署在APP中。 (3)用户使用流程设想如下:用户打开app后,能看见摄像头对准的实时画面,随着用户点击屏幕中的“开始估算PM2.5浓度”按钮,app会抓拍视野内的照片。 抓拍完成后,app会完成两项内容:①为用户实时估算所在位置的PM2.5浓度。该算法将会计算返回一个PM2.5浓度估计值以及污染程度等级(如优/良/轻度/中度/重度),并显示在用户界面上。②对用户所拍摄的图像进行视觉分析,获取关于周边环境PM2.5浓度的环境相关信息(如场所的类型,图像中的机动车、路面、树木等)。并在照片进行标注,并且根据用户所处的场所类型进行提示,在图片中标注处机动车和路面排放大气污染物、树木吸附大气污染物的情景。 2.PM2.5估测的校正 在应对复杂的真实情境时,委托方提供的PM2.5估测模型预测可能会产生误差。因此,委托方还希望能够根据附近监测站点数据进行校正。 具体而言,APP还会通过GPS定位以收集手机用户的空间位置,并且就用户手机与最邻近站点的实时PM2.5浓度数据进行匹配。当模型预测结果与最邻近站点的PM2.5浓度相差大于15微克每立方米时,则不对用户输出模型的预测值,而改为进行如下输出: (1)获得最邻近站点的监测数据,在该数据的基础上增加一个随机数值。随机数值的范围为2~10。这是根据委托方收集数据时经验制定的:通常,在街道上进行实测,得到的数值会略高于监测站点报告的数值。 (2)根据内容(2)提供的一些信息,对数值进行修正。譬如:当图像中的场景为公园或者住宅区时(这些地方通常植被茂密),则下调输出给用户的PM2.5数据。而当图像中的车辆较多(譬如,识别出的车辆超过某个阈值),则进一步上调输出给用户的PM2.5数据。并且给出提示或者警告(如:车辆较多,建议远离/植被茂密,适合停留等)。具体的方案取决于我们最后选择的API/模型可以识别出图像中的多少元素。 3.健康建议的推送 委托方希望制作方能够提供两个版本的APP:一个版本会为用户提供推送健康建议。另外一个版本则不会为用户推送健康建议。 (3)APP会为用户定时,或者在特定时机(比如说:拍摄到某些东西时),进行健康建议推送。体的方案取决于我们最后选择的API/部署的模型可以识别出图像中的多少元素。 4.用户位置动态 在用户许可的条件下,持续动态(比如每隔30分钟)收集手机用户的空间位置。
人工智能
¥18-30K/月

Caffe

5-10年经验

1个月

项目编号:【175842】 1.输入数据:建筑墙面图片,格式为JPG或PNG,图片大小和分辨率不固定(最大分辨率不超过20000*20000),图片中一般存在明显的遮挡、缺失、拉花、扭曲等问题。 2.输出数据:修复、重绘、补全后的建筑墙面图片,图片格式、分辨率保持和原图一致。 3.修复目标:建筑图片整体质量、清晰度提升(即修复成刚装修好后的干净、整洁的样子) 遮挡去除:建筑图片中遮挡物的去除,包括树木、积雪、衣物等非建筑元素。 缺失补全:对图片缺失区域需综合建筑颜色分布、窗户位置等实现墙面和窗户的自动补全。 拉花修复:对建筑图片中拉花、马赛克、模糊区域进行修复,包括进行超分辨率和重绘,以让该区域变清晰,同时符合墙面中不同区域和窗户位置的分布情况。 扭曲修复:针对建筑墙面图片中的窗户轮廓、广告牌轮廓和墙体等线条进行规则化和扭曲去除,还原建筑图片中正常的直线、弧形轮廓线条,并将扭曲、模糊的文字修复清晰、可辨认。 具体需求详见附件。
人工智能
¥1-6K/月

Caffe

5-10年经验

1个月

项目编号:【175838】 智能文档审核系统; 在这个开源项目上二次定制化开发 https://github.com/ChatGPTNextWeb/NextChat 后端接入的是Dify的API。 这个项目只负责前端开发和Dify API集成 本次项目,只开发上传的图片中的页面
兼职招聘
兼职招聘正式上线!40W+程序员、7000+企业方,急速触达!

我要找兼职

我要招聘