Page 1 of 1

amazon readability

Posted: 2006-06-26 16:23
by 密斯张三
贴一篇blog伪装读书笔记


※ amazon readability ※

密斯张三 发表于 2006-6-25 23:47:00

amazon书目有一栏explore: Text Stats 非常好玩的(什么样的人在做这种工作亚,文字计数!)里面列出了可读性(三个指标,以米国人的教育标准)复杂性(复合词、每词音节数、每句词数)以及字、词、句总数(配以价格及重量)。Concordance用大大小小的字体错落体现出镜频率的做法,web2.0现在似乎很流行。但amazon实在不能完全作宝典;它觉得容易读的书,你未必有同感。


例如最近在看的几本大众书。由易到难排列:

The Hitchhiker's Guide to the Galaxy
Readability: Flesch-Kincaid Index: 7.0
(统一指标,下同。读这本书需要念的米国年级;七年级=初一)
Complex Words: 10%
Words per Sentence: 12.6


The Undertaking : Life Studies from the Dismal Trade
Flesch-Kincaid Index: 9.1
Complex Words: 11%
Words per Sentence: 18.1

我却觉得这本undertaking要比hitchhiker's guide浅显易读得多,虽然guide更加“好读”有味。原因可能是,第一guide不顺从既定的思维方式,又太英式,一眼看去蛮有些生字;还要扮演科幻小说,瞎七搭八地甩了许多伪词。undertaking是美国书,词汇比较眼熟,背景文化更习惯些;年代也近;而我又看了太多six feet under



Beauty, The New Basics
Flesch-Kincaid Index: 9.4
Complex Words: 12%
Words per Sentence: 16.9

这本也很容易看,美容入门书来的 绝对富知识性,含机理详述,产品原料分析等等,内容翔实丰富(head to toe),完全基础,不hype不乱打广告,不是vogue类杂志的所谓美容师秘诀:请使用某某牌粉底! 该书还解决了很多萦绕我心头已久的谜团:toner是不是个大myth?苹果醋偏方的机理?大S早起不洗脸科不科学?等等。推一下。



Lolita
Flesch-Kincaid Index: 11.2 (高中为9-12年级)
Complex Words: 11%
Words per Sentence: 21.6

有个市名可以形容纳博科夫的写作风格:攀枝花。缠啊扯啊花胡梢啊(相对我的英文阅读能力)

……那我英文阅读能力有几多呢?7-11年级之间浮动。就是说,中学未毕业。谢谢。(算起来和我学英文的年头不是完全不符合的)

Posted: 2006-06-26 18:09
by Jun
这个看上去好象是机械地计算的,把词的复杂程度按照一个既定的建立在统计上的排行榜来套,加上数每句话有多长。我觉得,很笨,简直是没有AI的机器人搞出来的玩意儿。

(以上是我个人的猜测而已,请勿随便照单全收。)

写文章的复杂程度,其实不可能这么算法。举个中文的例子。。。[靠,我的古文太差,诗词也背不出来。谁能帮我想一句白居易的诗,“转教小玉报双成”那段怎么说的来着?]一句话,二年级小学生每个字都认识,但大学生也未必知道后面的典故。

Hitchhiker's Guide to the Galaxy, 一个七年级的学生读起来不用查字典,但是如果你对科幻小说的各色经典/subgenre不了解,对物理学天文学里面的一些风行的理论不了解,就不能明白他的那些双关,三关,四关的话,更别提领会其插科打诨下面的虚无主义思想了。

Posted: 2006-06-26 18:20
by Jun
above "你" -- 我不是指“密斯张三”你,而是泛指。

Nabokov has a lot of complex words in Lolita, but the main reason it is very slow (at least for me) to read the novel is all the implied "references" and suppressed belly laughs and satire he hides in the sentences. I had to pause at every sentence and think about what he REALLY meant when the character says something deadpan but slightly absurd. After a while I got tired of all the mental work and gave up.

Posted: 2006-06-26 18:25
by 火星狗
没品的我立刻去图书馆reserve了Beauty, the new basics。
白居易的诗还算浅显的呢,不过我恬为研究生,也不知道这个“小玉”是谁。
除了背景知识,还有个枯燥度的问题。Hitchhiker用词不算深奥,不过这世上一读Hitchhiker就打哈欠的人,一定很多很多(包括我)。如果没有点nerd精神,Hitchhiker简直是催眠书。

Posted: 2006-06-26 19:20
by CAVA
above "你" -- 我不是指“密斯张三”你,而是泛指。
Jun呀,下回你(这里指的是你JUN)干脆省略泛指的你好了。 :lol:

Posted: 2006-06-26 19:27
by Jun
That awkward sentence immediately exposed the truth -- I was thinking in English and translated the thought into Chinese.

[OK, time to dig a hole and hide ... :oops: :fish001: :action077: ]

Posted: 2006-06-27 0:40
by 密斯张三
Beauty, the new basics比较旧了,01年的?不过资讯并算不过时,里面推荐的产品也是比较经典的。

理解hitchhiker不需要太nerd的典故吧?(难道我nerd吗?nerd吗?吗? :f20: )很多是英国人板着脸睁着眼睛说瞎话的文字幽默,还有无文化差异的场景式荒谬,比如忧郁的机器人为了入睡数了274539(?)只羊,:worthy: 共花了一秒钟之类。

实际意义上真正的复杂性肯定不至于这么简单笼统,连amazon这种计数机也提供了三个index,另外单说词汇的难度就不是数音节能数出来的,就像笔画少的中文不一定容易一样,所以摘出来大家就看看玩儿好了。部分(无版权问题的?)书有全文输入嘛,虽然它只提供封面封底,但其实是全的,可以用surprise me挑出random一页来看。统计估计就是输入的时候算的,当然机器计数。我是指编程算这些个东西的人。amazon好像在和google合作网络图书馆,把扫描输入ocr这种工作outsource到低工资低成本国家去做,包括国内的超星(superstar!)等等。另一个idea就是发动全民, wiki那样共同输入,NYT前一阵有篇讲这个的文章。

纳博科夫我觉得还蛮好看的,文字游戏一堆,用字很斟酌那种,最好注释抵上正文长,是“你看我英文还不错吧!”的炫耀贴式写作。:mrgreen:

我说呢,你(特指jun)解释了这一车轱辘的特指泛指的,原来是英语思维。 :mrgreen:

Posted: 2006-06-27 6:43
by Jun
我脸红耳赤地说,前阵子还跟人抱怨现在的翻译成中文的书都是外国话的语法,直译原文到了死板的地步,读者得在脑子里把中文句子翻成英文才能懂(如果原文是俄语就惨了)。六月债。。。

Nabokov在Lolita的序里面抱怨用英文写着不顺手,没有俄语那么变化多端,美仑美奂,让他充分显白自己玩弄文字的本事。多数人以此为崇拜他语言水平高的证据/理由/借口,我倒觉得这说明他的英文是外国人思维下的英文,带有俄语的色彩,语法遣词之类固然漂亮,风格却是玩花的学院派加上俄语传统。英语本身,长于精,准,干净,表达意思效率高,其实运用高明的典范是George Orwell。

我不懂俄语,只是从朋友那里听来的,俄语时态人称极其繁复,结果是主谓宾成份不讲究顺序,可以随便放前后左右。结果呢,有文化的人就喜欢把话说得特复杂,特“漂亮”,以示与平民大众不同。切。非我信仰。

Posted: 2006-06-27 7:46
by 密斯张三
Orwell是最白话的,他顶看不起讲话弯弯绕的“知识分子”,管萨特叫风袋,a bag of wind.

Nabokov的英文我才开始看,不过已经觉得有点炼字太过。我以前不太确定,到底是直白、简洁、平凡的用词更准确,还是精微、冷僻、细致、少见使用因此意思较单一的用词更准确?我本来认为是后者;分类仔细的色谱不光看着精密,念着听也漂亮:“水底红,初日圆圆水底红。蛮锦红,窄衣短袖蛮锦红。桃毁红,妆成桃毁红。拨剌红,惊鼓跳鱼拨剌红。剪来红,清香拂袖剪来红。兽照红,松火红,宿烧红,大谷红,腮上红,後霜红,踯躅红,海悄红,舍利红,宫花寂寞红。” 好久才反应过来,我又哪里分得清什么是水底红什么是踯躅红! :speechless002:

Posted: 2006-06-27 7:56
by CAVA
Jun很不必面红耳赤,我打击面略大地说,这里大家讲话,或真或假,或多或少有点英文翻译成中文的风格。这能怪我们么,办公语言的影响,哼。
夏天已经在这里了
这是亦舒70年代写的文章,我今天考古的发现。从没想过Summer is already here听上去这么别扭。和1940年代被讽刺的“如欲停车,乃可在此”如出一辄。

Posted: 2006-06-27 7:57
by Jun
A link to Orwell's classic essay about the English language:

http://orwell.ru/library/essays/politic ... sh/e_polit
[/quote]

Posted: 2006-06-27 8:00
by Knowing
亦舒大部分时候译的还是通顺的。不能谁都跟林语堂比,把英文的意思用中文写的看不出是英文。

Posted: 2006-06-27 8:03
by CAVA
英语本身,长于精,准,干净,表达意思效率高
效率高大概是真的,较小的词库来表达差不多的意思。我听很多人说德语翻英语容易,反之较难,为什么呢?因为德语的表达精确得多,由简至繁不好把握。我一点德语不懂,听上去倒蛮有道理的。同样的,英语翻瑞典语也容易,这个我看瑞典电视的字幕时有心得。

Posted: 2006-06-27 8:21
by Jun
Chinese is not precise, but its charm is in the pictograms. It induces a cross-sensory response in the reader. Chinese is better (ie, more interesting) seen than spoken.

Some famous writer said, "Hard writing makes for easy reading." Hard reading does not good writing make. Easy reading demands skills and talent and hard work. Do not look down on writing that is easy to read.

Nabokov's writing is no easy read, but is at least good, and eventually rewards hard-working readers. The worst is often some scientists' writing: hard concept, hard writing, hard reading, and opaque communication. :speechless002: Or perhaps the worser are politicians and lawyers. Reason: See Orwell's essay above.

Posted: 2006-06-27 8:26
by 密斯张三
Jun wrote:Chinese is better (ie, more interesting) seen than spoken.
:worthy:
Knowing wrote:亦舒大部分时候译的还是通顺的。不能谁都跟林语堂比,把英文的意思用中文写的看不出是英文。
小人地揣测她就是故意译得不像中文,好带来新鲜感。

我觉得那种一看就是很硬很苦的科技文章也就罢了,匝一看难,确实也是难。花巧的那种比较可怕,匝一看天花乱坠,结果什么都没说。代表人物:胡兰成

Posted: 2006-06-27 10:09
by 森林的火焰
密斯三你的身份在传统定义下是nerd的中坚骨干,认了吧,啊,我大模大样地说。 :f59: