职位详情
五险一金
加班补助
年终奖
股票期权
带薪年假
员工旅游
交通补助
包吃
节日福利
工作职责:
负责多媒体(包括但不限于图片和视频)的内容理解工作。
对多媒体内容进行特征提取,例如尺寸、清晰度、人脸识别、二维码识别、暴力或色情识别等。
根据图文关联性,识别出网页中与图像相关的关键词或标签。
执行相似图片检验,识别并处理重复或相似的图像内容。
计算图片质量分数,并据此进行优化调整。
构建图像和视频检索的多模态模型,提升多媒体内容的检索质量和效率。
职位要求:
计算机科学或相关专业本科以上学历,3年以上相关工作经验。
具备计算机视觉和图像处理相关经验,对多媒体内容理解有深入理解和实践经验。
熟悉经典的视觉模型和多模态模型,例如Vision Transformer, CLIP等。
具有深厚的数据结构和算法基础,精通Python、C++等至少一种编程语言。
熟练使用深度学习框架,如TensorFlow、PyTorch等,具有良好的理论基础和实践经验。
具备良好的团队协作精神和沟通能力,有责任心,能承受一定的工作压力。