尤其是现在的可视化系统,会耗用大量的内存,留给应用的,可就已经不多了。”
“随着技术的进步,这些总是可以解决的嘛。”辜幼文说道:“就如肘子所言,我们可以先有思路,有理论,有储备,”
说完拍了拍那堆字稿:“有这些东西,先标准后应用,我看是完全可行的嘛!”牉
“其实这就和标准计量局里的铂金度量衡一样,”旦增笑道:“标准制定的时候我们不妨就高,等到应用的时候,再因地制宜嘛。”
“其实只要有了标准点阵字,将字库拓展出来就不难了。”李红江有些兴奋:“因为不管汉字是复杂还是简单,是繁体还是简体,其基准笔画和部首结构都是一样的。”
“也就是说,我们完全可以使用GB2312和GB13000的笔画耦合技术,有了点阵字,就可以创造出黑体,宋体,仿宋,楷体四种基准字体。”
“对,这就是我们汉字的优势。”周至说道:“我们的字稿上,点阵字以外的其余三种字体,其实是用来给李教授他们做修正用的,如果李教授认为没有问题的话,今后我就让我同学专门写点阵字了。”
“肘子你这同学也是高中生?那他有没有兴趣来我们计算机系啊?”
“呃,我这同学是水电校,职高那种,已经毕业参加工作了,在蛮州电力公司。”周至说道:“对了我还有个要求,李教授,如果用了我们的字稿,研究者当中,我希望把我同学的名字加进去。”
“现在就剩下开发扫描程序和编码了。”李红江拿两根手指敲着下巴,陷入了思索:“还是时间的问题,要是能够赶在GB13000推出之前最好。我们说服标准委员会的机会更大……”牉
“其实我还有一个思路,”周至说道。
“你讲你讲。”麦明川现在看着小子一百个的顺眼,理论上这小子已经将大家的思路给打开了,也将最难的水磨功夫都做了,现在就剩下一个入库和编码的问题。
而这两样,国家在编写GB2312和GB13000的时候,已经有了长足的经验。
“其实我们还可以反向操作。”
“什么反向操作?”
“开发一个文字识别软件。”周至说道:“一个能够识别汉字,将汉字加工成点阵字,再将之按照偏旁部首等一定的规则,给汉字自动赋予编码,将之放入字库码位的软件。”
“设计思路有吗?”李红江的这下兴趣来了,中文识别,好东西呀。牉
“这个程序的设计思路是这样的。”周至说道:“因为汉字本身是有一定组织规则的,以方块字为主,因此我们可以利用这些规则去扫描它,对其进行分析。”
“理论上每个汉字,尤其是印刷体,其重心位置,中宫收放等特征,在一本典籍当中都是同一的,我们可以通过广泛采样,得到均值,再将这些均值作为汉字的字体设计参数,赋给已有的点阵字,产生与典籍一样的字体。”
“如果反过来思考,我们可以认为,每一个典籍上的文字,都是被字体算法计算出来的图形,而这个图形,本身是全覆盖其点阵字的所有边界的。”
“如果我们对其按照之前扫出的参数进行反耦合,也就是做减法,理论上是完全可以将文字图形,减缩成标准点阵字的。”