从基金申请书下载后缀真的能看出基金中没中吗?
大约在6月份,muchong上出现了本年度第一个关于国家自然科学基金申请书后缀问题的讨论贴,自此宣告一年一度的预测大戏正式拉开帷幕。
各位虫友纷纷发表自己的见解,有的贴出自己的申请书下载后缀让别人帮忙解析,有的根据小道消息拿后缀来验证或推测,有的把往年的后缀翻出来讨论,也有的劝大家洗洗睡吧别当真。即便版主一再封杀,奈何虫友们兴致太高,有段时间打开muchong总看到清一色包含 “后缀”、“FS01”等字眼的帖子。连一向稳如泰山的我,都被撩拨的忍不住多看几眼。尽管我在内心极力劝说自己这些都是娱乐不要当真,但还是抱有一丝憧憬。
这仿佛是“三人成虎”的现实版:一个人说不信,二个人说不信,三个人说就信了。
然而,冷静下想想,从下载后缀名来判断基金中没中究竟有无合理性呢?这里,我从计算机文件存储的角度来分析一下。
基金委每年受理的申请书有几十万份,这些申请书文件以及申请者相关信息都需要存放在计算机中。一般来说,和申请者有关的结构化数据可以存放在像mysql这样的数据库中,而申请书这样的大文件因为是非结构化数据,需要放在其它位置。为保证两者能一一对应起来,申请书存储时确实需要调整名称。比如利用申请者的个人信息生成一个md5值,然后申请者提交的申请书文件就以该md5值命名(上传文件时,程序自动处理)。我们平时讨论的申请书下载链接中的一堆乱码和这样的md5值有关。
此外,由于申请书文件太多,一台服务器还真的不一定够。假设一个申请书大小为2M,本年度共有30万份申报书,则申请书总大小就是600G,再加上专家评语等文件,接近1T是有可能的。基金委用的服务器应该比较老,存储时又不可能把硬盘全塞满,这样算有2-4台才能满足存储需要。下载后缀中的FS01,02等大概率就是服务器编号(FS可看成File Server的简写)。
申请书发给专家审阅后,由专家在后台给A、B、C等级和评语。这些ABC字符可以直接放在mysql数据中,而专家评语以文件形式存放在其它位置。申请书是否获批也就是添加像‘Y’或‘N’之类的字符,这也可以输入到mysql中。因为只有几十万条数据,查询某个申请者的本子是否得中其实非常快,扫一下mysql即可,完全不用修改申请书文件名称,也不用把文件从一个服务器挪到另一个服务器。
当然,如果这个程序员闲得无聊,非要在本子上会后修改文件名称,那么他也完全可以这么干,只是要多费点时间。但是这样干吃力不讨好,还容易泄露机密,甚至丢掉饭碗,谁会蠢到此等地步呢?
所以,希望大家把关于后缀的讨论当成一种消遣即可,莫当真。
个人观点,仅供参考,欢迎讨论!
出处:https://mp.weixin.qq.com/s/wcbidWXcEKFSUZNpb3o3Mg