Human-Computer Interaction Part I

这段时间开始读一本人机交互的入门书籍,Alan Dix等人写的Human-Computer Interaction。这两天刚看了Part1,在这里记一下笔记。Part I 的内容是整本书的基础(Foundations),这一部分分为三章,分别是The human, The computer, and The Interaction。这样子的章节安排非常容易理解,首先分别介绍人和计算机两个实体,然后在介绍他们之间的联系。对于人和计算机,又把他们抽象成这么一个模型:输入-输出、存储(memory)和数据处理(processing)。
对于人这个模型,书里提到,在人机交互领域里我们应该利用认知心理学(Cognitive Psychology)去学习和理解人的行为。首先是人的输入,主要有就是常常听说的五感了,其中在这里重要的就是视觉了。其次就是听觉,说人的耳朵的分辨率还是不错的,只是现在这一块还没有被广泛地做为输入。除此之外,人的听觉可以进行选择性获取信息的功能也非常强大。最后稍微提到了触觉,对于那些前两个感觉不太强的人,触觉尤其重要。关于人的输出部分等我在机器的输入我再介绍。
之后讨论的就是人的记忆功能。主要有三个类型,分别是sensive buffer, short-term memory and long-term memory。第一个指的是任何转瞬即逝的感觉,这种感觉可以来自视觉、听觉和触觉等等,比如我按下键盘那么一瞬间指尖的那个感觉。第二种,短期记忆,比如计算35*6时,得到的30或者180中间数就归到这个记忆的范畴里面来。包括我们有时候记忆的电话号码也属于短期记忆。最后也是最重要的,就是长期记忆了。它包含了我们日常生活的各种信息、学习得到的知识。对于如何将短期记忆转换成书中提到了一个词:反复(rehearsal)。想起来那天涛哥问我如何记住单词,我想到的也是这么一个词。
最后是关于人信息处理的分析,总体上可以将其归为两类:认识(reasoning)和解决问题(problem solving)。前者是人获得信息的这么一个过程,主要有推理(deducive reasoning)和归纳(inducive reasoning)两个方法。然后又说了推理有时候是无效的,而归纳大多数情况下则是无法被证明的。
这里有一个很有意思的实验,桌子上放着四张牌,正反两面都写有字母或者数字。现在你只能看到这四张牌的一面(因为放在桌子上了),分别是”4″,”E”,”7″,”K”。你应该从中选哪张牌(一张或多张)来检验(test)下面这个结论:“如果一张牌的一面为元音字母,则其背面为偶数” 。关于答案写在文章最后好了。
关于人说那么多,总结就是:我们应当在了解”人”可以做的事情(capabilities)和无法做的事情(limitation)的基础上对系统进行设计,这样的设计才可以较好地做为让人与机器进行交互。而上面的这些东西的学习资源就是认知心理学啦。
关于计算机的模型,输入-输出想必大家听得也比较多了。输入常见的主要有文字输入、定位-点击设备两种。前者的代表就是键盘了。后者除了鼠标以外,像触摸板、铁笔,包括像wii那样的手柄都可以算到这个部分里来。关于输出,就是显示器、打印机等等。而对于计算机的memory,就像操作系统和体系结构等课上讲的一样,不过没有那儿那么详细。这里主要就分成两类:内存(RAM)和外存(disks)。内存速度较快,容量较小,断电后内容会丢失。外存则容量大,而且可以在断电的情况下较长时间地保存信息。
最后一章讲的是交互。这里有一个模型,首先用户是为了完成一项任务(task),用户会用输入的形式来表述(articulate)他的目的。用户如何去表达他想做的事情是一种心理活动,关于输入,很重要的一个地方就是让用户心中想做的事情与正确的输入形式进行对应。一个常见的失败例子是:在教室,我们想关上放PPT的那块布(汗”’)前的灯,但是面对众多的开关,我们不知道应该按哪一个,只能一个一个去试。如果在某个按钮旁贴一个提示的标签就好了,因为较常用的就只有那一个开关。
下一步,输入会生成一个信号传递给系统。系统接到信号以后进行处理,处理完以后又会产生一个信号传递给输出模块。对于输出的内容也是需要斟酌的,因为许多时候用户需要看到的并不是所有的处理结果。
输入和输出的模块就被称为“界面(interface)”。
后面又介绍了一些交互方式:命令行、菜单、自然语言、提示对话框、问卷和表格、WIMP、定位-点击和3D交互方式。相信这些大部分都非常耳熟能详,我也不详细介绍了。就提两句:所谓的WIMP其实就是最最常见的窗口系统,根据它几个最最常见的部分命名(windows, icons, mice and pull-down menus)。而那个定位-点击交互方式最常见的地方就是互联网了,几乎各个网站都是采用这么个方式。然后关于自然语言,除了识别以外,二义性也是很大的问题,不过对于某些专有领域,还是非常有用的。
第一部分的内容就介绍到这里好了,第一部分绝大部分都是一些入门概念的介绍,所以记起来比较流水。本来昨天写了一半实在写不下去了,但因为今天拿起许久不看的Computer Networks,几乎一点记忆都不剩了,感到笔记还是相当重要。加上你如果读完全文,应该感觉得到我的笔记水平真不咋滴,所以更加需要练习嘛:P 
 
ps1:对于前面那个题,不知道有没有同学会选”4″和”E”,其实应该选”E”和”7″两张牌。因为对于验证那个结论的正确性,我们应该去检验其反例。
ps2:
to这个blog的读者:
由于没有备案,貌似这个网站有间歇性被GFW的问题,所以推荐利用阅读器订阅我的blog进行阅读。feed在网页的右上方,选择一个你使用的阅读器,猛击鼠标就好了。
不知道什么是阅读器?没关系,推荐阅读阿瓦的家上的这篇文章《RSS入门及订阅指南》 。读完之后如果感觉不错,回来之后请用鼠标猛击我blog网页右上方的feed图标。
最后,如果你觉得阅读器、RSS什么的实在太复杂了,欢迎使用邮件订阅我的blog哈。只需要在网页右上方那个”E-Mail”的橙色图标上轻轻按下你的鼠标就好了:D

2 Replies to “Human-Computer Interaction Part I”

  1. HCI 是很重要,可是核心技术却在CV,control,ML,DSP和embedded system这些领域里,MS的kinect就是一个很好的例子. 不知是否如此? 还望赐教.

Leave a Reply

Your email address will not be published. Required fields are marked *