默认冷灰
24号文字
方正启体

第51章 任务分析

    交完卷,江寒出去等了一会儿,与李东、洪锐、李亚男会和。

    一起去食堂吃完晚饭,四人就回了403寝。

    今天有点不同往日。

    洪锐也不上蹿下跳了,躺在床上发呆,目光无神,也不知在想些什么;

    李东唉声叹气了几下,然后趴在床上,蒙头大睡;

    李亚男依然坐在窗口的小桌前,一刻不停地刷题……

    江寒看了看洪锐:“猴子,没考好?”

    洪锐默不作声。

    江寒就想开导几句,比如“下回努力,事后后悔有个屁用?”之类的。

    没想到……

    “不要问我成绩,也别怕我自闭,我只是有点乏力;

    我没有感到压抑,更加不会哭泣,明天我要努力,上演一出好戏,让你们五体投地!

    尽管这不容易,但我绝不放弃,看我高考及第,走出自我足迹,留下精彩回忆……”

    洪锐居然干哑着嗓子,rap了起来。

    江寒就啥也不想说了,默默打开了macBook。

    白担心这家伙了,还能rap,就算有事儿也没多大……

    电脑开启后,江寒没有进入macos,而是按住了左边alt键。

    等引导菜单出现后,用方向键调整到“windows”图标上,按下了回车。

    这样系统启动后,就进入了win7。

    插上老高给的u盘,双击打开“计算机”,然后点击“可移动磁盘”图标,进入文件管理界面。

    u盘里有三个文件。

    “照片.rar”,300多mB;

    “报名信息.xls”,10来兆的样子;

    “原始数据.xls”,30多兆。

    江寒先下载了一个数据恢复软件,仔细研究了一下老高给的u盘。

    有时候,通过研究数据的存储方式、文件格式以及磁盘扇区的写入历史等,是可以用技术手段恢复部分数据的。

    所以,有人以为文件被删除,就找不回来了?

    不一定。

    硬盘格式化,就安全了吗?

    也难说。

    那么,重新分区呢?

    很遗憾,只要有心,还是可以复原的,否则也不会有“x照门”了……

    那么,反复用垃圾数据涂抹、覆盖原始文件,这总行了吧?

    理论上是可以的。

    不过,你得熟悉计算机存储系统的工作机制。

    对于不同类型,和不同介质的存储设备,要采取针对性的策略,才能彻底销毁数据。

    比如支持并开启TRIm的ssd,也就是固态硬盘。

    写入数据时,由芯片控制,数据均匀分布在每个区块里,以保证均衡使用全部的存储颗粒。

    系统在删除数据时,并不会向硬盘发出删除指令,只使用Vo露meBitmap来记录被“删除”的信息所在的位置。

    而每次文件数据时,也会尽量写入新块,并把原本占用的区块,标记为“无效”。

    这样一来,实际上,被删除或顶替的数据,在物理上仍然存在。

    当且仅当所有空闲区块都占满时,才会在写入数据时,使用被标记为“无效”或“删除”的区块。

    也就是说,没有方法能够可靠地删除整个ssd上的内容,或者存放在ssd或者u盘上的特定文件。

    靠文件粉碎机制都很难彻底消除痕迹,就算格式化后,用垃圾数据把盘写满,也并不能万无一失。

    有些数据恢复高手,会有许多让你瞠目结舌的操作。

    可惜的是,高老师的这个u盘,可能只是一份拷贝,并不是原始数据盘。

    这样一来,数据还原软件也无能为力。

    经过一番研究,江寒发现,并没什么投机取巧的可能。

    也就是说,只能按照原定计划,重建信息表。

    高老师提供的《报名信息表》残缺不全。

    只有不到30%的行,还保留着性别、民族等寥寥几列。

    剩下的70%,除了姓名和序号,什么都没有了。

    住址、联系人、联系电话等等,一点也没剩下。

    至于《原始信息表》,的确如老高所说,除了身份证号缺了几位,其他数据都正常。

    那么,这种现象是怎么造成的呢?

    江寒有个初步的猜想。

    这两个表格的标题、表头,和数据排列方式,很像某些web应用,利用模板自动生成的。

    那么不妨设想一下。

    应用场景可能是这样的:

    原始数据存放在某个网站,姑且命名为a站;而各学校的业务操作员在B网站上,通过一个web界面,执行报名操作。

    业务员具体操作时,可以通过输入学籍号或其他方式,从a网站的后台里调取相关信息,保存在B网站的后台数据库。

    当各学校登记完报名信息,再用B网站web端的导出功能,生成excel格式的《报名信息总表》……

    已经从高老师口中确定,《报名信息表》是《原始数据表》的真子集。

    对于江寒来说,这是好事。

    这样他在处理数据的时候,可以省去很多麻烦。

    而且,还能避免一些莫名其妙地问题。

    例如汉字编码不一致,或者数据里掺了“沙子”等等。

    ——所谓“沙子”,指的是某些可见或者不可见的垃圾字符。

    不妨继续猜测一下,老高这两个数据表的来源。

    老高的工作,很可能是负责导出、报送《报名信息总表》。

    某天,管理员老高忽然发现,导出的数据出了问题。

    可能的原因有很多,比如:保管不善、介质损坏、误操作……

    反正不管怎么样,数据坏掉了。

    这样一来,一个很自然的想法:既然数据损坏了,那就去web应用里,重新导出一次呗。

    而老高几乎肯定会这么做,但结果很可能是失败了。

    也许是服务器关闭了,也许被裁撤了,也许数据盘坏了,也许导出功能有Bug,也许是网站被黑了……

    甚至可能还有某些匪夷所思的情况,譬如:机房进水、服务器硬盘损坏、关键硬件物理消失等。

    嗯,什么叫物理消失?换一种说法,就是“所有权非自愿转移”。

    也就是说:被偷了……

    总之想要重建数据,依靠B站是办不到了,老高手里的报名表,也就变成了独一份。

    而就这么一份,偏偏还坏掉了!

    老高又基于个人原因,比如怕上面发难,怕领导斥责,怕在同行面前丢脸……而不愿声张。

    于是很正常的思路,老高就去a站找原始数据,重建《报名信息表》。

    那么,如何才能搞到原始表,同时还不惊动任何人呢?

    很简单:黑客。

    换了江寒遇上这种倒霉事儿,实在没招的话,十有八九也会这么干。

    不管怎么说,老高还是有点水平的。

    如果是政府网站或者商业重站,他可能还没那个技术,也没那个胆子。

    但区区“学生信息管理系统”,想要黑进去,还真没啥难度。

    你是天才,一秒记住::