即构参编《深度学习算法框架通用接口规范》,是时候揭秘这些宝藏算法了!
2024/01/26

近期,深圳市人工智能行业协会联合即构科技及其他科技公司,共同制定并发布《深度学习算法框架通用接口规范》团体标准。该文件是为深度学习算法框架提供统一接口的标准,规范了面向多任务、跨算法框架通用应用接口目标、接口模型以及接口库的技术要求等。

即构科技作为该文件的起草单位之一,在深度学习算法领域具备硬核实力,并将算法与工程化能力相结合,推动AI应用落地。目前,即构科技已经申请《考场监控方法、电子设备及存储介质》、《基于考场违规的深度学习模型训练方法》、《模型构建方法及目标检测方法》、《一种高保真数字人生成算法》等30多项AI算法相关专利。此外,即构科技还荣获深圳市人工智能行业协会颁发的“行业创新活力奖”、“最佳AIGC企业”等奖项。

那么重点来了

这些算法技术放在哪些产品中?

在什么场景下使用?

能带来什么效益?

现在就来揭晓!👇

即构小艺帮

– 促进在线考试公平公正,便捷考生操作 –

在线考试服务平台——即构小艺帮app,通过算法来促进在线考试公平公正,同时也让考生在考试前、考试后的操作,以及平时的练习更加便捷。

算法小笔记

  • zego违规检测算法:为线上考场提供防止考生作弊的能力,能自动识别考场中的违禁品,如可显示电子设备和多余的人员,该算法在端侧运行,识别到违规信息后自动上报到云端。
  • 人头打码、号牌打码、姓名牌打码、二维码检测和打码算法:应用于舞蹈、播音主持等线上考试场景,为了保护考生隐私以及防止考生串通考官作弊,对包含个人信息的部位进行实时打码遮挡。
  • 考试报名——自制人像证件照算法:考生上传任意一张正脸人像照片,会将图片处理为标准一寸证件照并将背景替换为统一的颜色。
  • 书法和绘画考试——文档裁剪与矫正算法:考生将自己的作品拍摄下来,上传至小艺帮APP,后台的该算法将对考生拍摄的不规则作品图片,进行检测、裁切并校正为正视图。
  • 平时练习与考试——视唱评分算法:考生通过小艺帮APP进行视唱练习,该算法可进行AI评分,从音准和节奏上给予考生及时和客观反馈。

数字人应用

– 为企业发展提质增效 –

AI 数字人将企业员工从大量繁琐、简单的工作中解放出来,去做更高效的工作,已经成为帮助企业发展提质增效的重要工具。

即构数智人已经帮助直播、金融、新闻、文旅等行业客户实现提质增效,此外,即构科技图片生成数字人技术也在数字人面试官、PPT录课、短视频制作等场景中,贡献新价值。

算法小笔记

  • 图片数字人:AIGC数字人中的一个方向,用户上传一张人像照片和一段音频,就能生成该用户的数字人分身,口型精准、动作自然。可应用于数字人面试官、PPT录课、短视频制作等场景。
  • 即构数智人:拍摄一段目标模特的视频,即可高拟真定制该模特的数字人,在嘴形生成的基础能力之上,额外拓展了真人表情驱动、文本驱动、肢体动作自定义交互等能力,配合大模型和知识库,助力政企、金融、客服、直播等行业发展提质增效。
  • TTS(文本转语音):指将指定的文本生成对应的音频文件,支持多种音色,如新闻音色和自然音色,同时支持语音克隆,按照指定人的音色进行生成。

直播、1V1语聊房

– 智能实时“调色”,提升画面质感 –

在直播、1V1语聊房场景中,外界环境“不友好”比如光线暗的时候,主播视频画面清晰度低,容易有噪点,粉丝的观感体验就很差,画面“又黑又糊”,很容易就丧失耐心,退出直播间。但即构的宝藏算法能够在光线暗的环境下,对主播开播视频画面进行“调色”,提升直播画面质感,可以理解为一个智能、实时的“调色插件”。

算法笔记

  • zego暗光增强算法:在低照度条件下能够有效提高暗部细节的可见性,增强图像的对比度并且改善图像质量,提升客户在暗光环境下的体验。
  • zego视频降噪算法:有效减少视频中的噪点,提升视频的整体质量,与暗光增强算法结合起来使用,有效抑制暗光增强后产生的噪点。
  • zego色彩增强算法:能够自动识别并增强人体的肤色和唇色,提升肤色和唇色的饱和度。
  • zego人脸美颜算法:通过稳定精准的人脸和关键点检测技术,能够跟踪人脸的位置,支持自定义和默认参数下的美颜、美妆等效果。

(此处省略我们已经和大家说过的绿幕抠图、自然背景抠图、回声消除、音频AI降噪、zego视频超分辨率算法……)

以上就是即构宝藏算法开箱

欢迎大家来体验~

更多详情,欢迎扫码咨询👇

扫一扫,获取更多服务与支持
热门推荐
H.264 与 H.265 视频编解码器的区别,哪个更好?
2024/07/26
直播产品中的“六边形战士”来了!ZEGO 超低延迟直播,高质量带来新增长!
2024/07/23
什么是抖动?如何使用抖动缓冲区来减少抖动
2024/07/22
热门标签
AI 降噪
AI课堂
ExpressSDK
MSDN
RTI
SEI
webrtc
ZIM
互动白板
即构融资
在线KTV
在线K歌
屏幕共享
录屏采集
数智人
直播技术
范围语音
行业报告
语聊房
语音社交
超分
音视频
音视频开发
音视频技术
音频编码
关注我们
获得更多服务与支持了解价格与优惠 扫码关注我们
关注我们
获得更多服务与支持了解价格与优惠 扫码关注我们