刘铁岩:科学问题的样例
样例1:
15年前,搜索引擎背后的技术其实是比较落后的,很多人都是靠拍脑袋,想出一些经验的、启发式的公式。针对这样的情况,包括我在内的一些学者共同提出了一个科学问题:我们能否用计算机自动学习一个性能优异的排序模型?
今天主流的商业搜索引擎背后的技术几乎无一不是排序学习技术,而排序学习技术就是典型的“提出重要科学问题”的研究。
样例2:
五六年前,那时候人工智能的技术有着突飞猛进的发展,解决了很多实际的问题。不过,那时主流的机器学习技术,需要大量人为标注的样本。以机器翻译为例,通常需要上千万的双语语对来作为训练数据,才能训练出一个性能优良的机器翻译模型。然而,不是所有的人工智能任务都能够获得这样丰富的数据。比如,很多小语种全世界可能会讲这个语言的人都没有几个,更不要说找到人来标注大量的双语数据了。在这个背景下,我们就提出了一个科学问题:是否可以利用机器翻译这类人工智能任务的某种结构特点,在不需要大量标注样本,甚至不需要任何标注样本的前提下,就能够学到有效的人工智能模型?
这个科学问题就是对偶学习技术,它在机器翻译、图像识别、语音合成等多个领域达到了世界上当时最好的效果,超越了人类专家的水平。
除了前面提到的这两种高质量研究以外,如果你通过自己的不懈努力,显著地超越了前人的工作,比如比前人工作的精度更高,比前人工作的速度更快,或者是在某些层面上比前人的工作具有了更深的洞察,那么恭喜你,你的研究也是一份质量非常高的研究。