zoukankan      html  css  js  c++  java
  • 在人工智能浪尖的数据标注公司如何乘势而起(二)

    在上一章中我们着重分析了“准确判断数据标注需求公司的需求方向”、“精准定位数据标注需求公司的拓展范围”这两点,在此章中我们着重总结一下“如何维系与数据标注需求公司之间的渠道关系”、“与数据标注需求公司合作禁忌”这两个话题。

                                                                                                           

    言归正传,我们先浅谈一下“如何维系与数据标注需求公司之间的渠道关系”。

    说到“如何维系与数据标注需求公司之间的渠道关系”总是绕不开两点。

      1. 如何做人

      如何做人这其实是一个非常宽泛的概念,这里我不展开来说。所以在如何做人环节我们这里只总结一些在面对亲朋好友、领导同事、客户合作商之间有共通点的特征加以说明

        a) 态度真诚 真诚其实就是如何做人的根基,因为真诚可以通过时间转化为信任。 所以不论是第一次打交道,还是已经是长久的客户关系,保持真诚,通过真诚建立起来的信任有时候甚至可以比肩契约精神。

        b) 言而有信 其实我们每个人受限于个人阅历的不同,很难做到说到做到。但是对于甲方客户,约定的工期、约定好的某件事情,一定切记不要轻易改变。说到做到,对客户的体验来说是重中之重。

        c) 成人之美 对于甲方的需求,是要保持一种积极协助甲方解决问题的状态,因为很多做算法外包的AI公司其实对于数据标注的经验来说还不一定有数据标注公司丰富,一方面是接触的数据种类和场景有限,另一方面是算法工程师也没有大量的时间进行  数据标注工作。所以,在规则敲定后还是需要在正常上传数据时保持一个良好的沟通状态,这种协助的态度会快速的丰富甲方对于获得数据的认知,进而更好的进行相关合作。

      2. 如何做事

      如何做事在数据标注行业有比较明显的特征,下面我们就列举几个展开来说

        a) 认真仔细 标注的数据作为甲方训练模型识别的关键,标注结果的优劣是影响甲方模型识别正确率的重要参数,而识别正确率直接影响了甲方的行业竞争能力,所以根据甲方的标注文档进行认真仔细的处理就显得尤为重要。

        b) 加强专业领域知识学习 因为很多AI公司都是做算法外包的,本身不涉及大量数据的标注工作,但是标注数据的场景是千变万化的。比如:在无人驾驶领域的车道内元素标注,就会有各种各样规则文档中并没有涉及的情况出现,如果有相关的AI知识储备作为支撑,与AI公司的工程师沟通起来就会事半功倍,同时会让公司脱颖而出,被客户许以专业的美名。

        c) 能够吃苦耐劳 像所有行业都有简单的工作和复杂的工作一样,数据标注也有简单的标注和复杂的标注,复杂的标注耗费的培训时间更多,更需要大量的沟通,这无疑在公司运营中都是成本。在能够通过加班获取客户的时候,一定不要吝惜时间,因为AI公司本身就是属于高成长公司的一类,看似眼前很小的标注数据集,在未来只要AI公司成长了,数据需求都是会成几何增长的势头。

    接下来,我们谈谈“与数据标注需求公司合作禁忌”。

    说到禁忌当然是在合作中最需要注意的问题,这里我们浅谈几点。

      1. 经验论

        经验论就是拿A公司(已结项)的标注经验直接套用到B公司的标注实施中,这里的套用经验主要是指标注类型和场景相似的标注需求。因为涉及到培训、沟通等一系列成本问题,很多项目经理一看到B公司的需求和A公司的很相似,为了节省时间,习惯性的就把A公司的需求作为参考,更有甚者对B公司的需求文档都不会仔细参阅,直接以经验安排运营。因为任何AI公司对于数据标注结果的需求都是有差异的,在没有被AI行业确立为何种标注之前,这种差异化是长期存在的,那么如上经验论的风险不言而喻,只要返工一次,基本上就无利润可言。

      2. 削减质检成本

        一般标注公司质检员(全检)与标注员的比例是1:5-1:8,超过1:8这个阈值,全检的质量就会明显下降,最终会导致交付到需求公司手中的数据大概率出现问题,所以在公司运营中确实需要削减成本时,切记不要拿质检开刀,不然得到的一定是惨痛的教训。

      3. 盲目贪大

        这个盲目贪大主要是指在与AI公司的合作中碰到有海量数据量需要处理时,标注公司喜欢联合周边同行,共同协作拿下项目。这种看似协同共赢的案例其实为后续埋下了重大的隐患。首先,数据质量的把控就非常的耗费人力和时间,因为涉及到多个公司的协同完成,同公司内部标注人员的质量和效率都是参差不齐,更别说多个公司多个标注员协同完成;其次,涉及数据修改后,周期会非常拖沓,因为沟通和纠错成本其实已经远远超过标注成本本身;最后,容易推诿扯皮,因为多家协作一定会出现不同人之间传达规则上的误差,最后就会导致一家一个说法。

    以上就是这章的全部内容,我们会在接下来的时间内持续更新更多精彩的内容。欢迎有兴趣的朋友持续关注 觉醒向量丨awkvector 官网 www.awkvector.com及Blog更新。

    ©著作权归作者所有:来自觉醒向量数据标注的原创作品,如需转载,请注明出处,否则将追究法律责任。

  • 相关阅读:
    Python函数之冒泡算法
    Python内置函数之--open
    Python 基础5:内置函数一
    27、数组的操作
    26、字符串的操作
    25、求最大公约数和最大公倍数——循环
    24、输出九九口诀乘法表——循环
    查找【操作】
    04、结构体两种传参形式
    1、电脑联网小技巧:网络共享之台式机、笔记本、手机
  • 原文地址:https://www.cnblogs.com/AWK-vector/p/11314538.html
Copyright © 2011-2022 走看看