新Blog的域名
ffffffffffffffffffffffffffffffffffffffff
You are viewing
gnap_an's journal
| This Is My Life, Rated | |
| Life: | |
| Mind: | |
| Body: | |
| Spirit: | |
| Friends/Family: | |
| Love: | |
| Finance: | |
| Take the Rate My Life Quiz | |
( S 1.95955e-05以上的一个句子的两种歧义,由于条件概率的乘法公式,其NP和PP的组合歧义无法消除。
( NP 'I' )
( VP 2.61274e-05
( VP 0.001008
( V 'saw' )
( NP 0.00168
( NP 'John' )
( PP 0.0336
( P 'with' )
( NP 0.056
( Det 'a' )
( N 'dog' ) ) ) ) )
( PP 0.0864
( P 'with' )
( NP 0.216
( Det 'my' )
( N 'cookie' ) ) ) ) )
( S 1.30637e-05
( NP 'I' )
( VP 1.74182e-05
( V 'saw' )
( NP 2.90304e-05
( NP 0.00168
( NP 'John' )
( PP 0.0336
( P 'with' )
( NP 0.056
( Det 'a' )
( N 'dog' ) ) ) )
( PP 0.0864
( P 'with' )
( NP 0.216
( Det 'my' )
( N 'cookie' ) ) ) ) ) )
( S 1.95955e-05
( NP 'I' )
( VP 2.61274e-05
( VP 0.15
( V 'saw' )
( NP 'John' ) )
( PP 0.000580608
( P 'with' )
( NP 0.00096768
( NP 0.056
( Det 'a' )
( N 'dog' ) )
( PP 0.0864
( P 'with' )
( NP 0.216
( Det 'my' )
( N 'cookie' ) ) ) ) ) ) )
( S 1.30637e-05
( NP 'I' )
( VP 1.74182e-05
( V 'saw' )
( NP 2.90304e-05
( NP 'John' )
( PP 0.000580608
( P 'with' )
( NP 0.00096768
( NP 0.056
( Det 'a' )
( N 'dog' ) )
( PP 0.0864
( P 'with' )
( NP 0.216
( Det 'my' )
( N 'cookie' ) ) ) ) ) ) ) )
美国的科学只存在未来,它没有今天和过去。在我这个位置上的人应该思考的问题是:我们必须要做些什么才能创造出我国的物理学,而不是把电报机、电灯和其它
的便利设施称之为科学。我并不是想低估所有这些东西的价值,世界的进步需要依靠它们,成功发明这些东西的人应该受到世界的尊重。但是,虽然一位厨师发明了
餐桌上的一道新鲜的美味佳肴,使世人在某种程度上享受到了口福,但是,我们并不会尊称他为化学家。但是,人们将应用科学与纯科学混为一谈并不是罕见之事,
特别是在美国的报纸上。一些卑微的美国人偷取过去伟大人物的思想,通过这些思想在日常生活中的应用让自己富裕,他们得到的赞美高于那些提出这些思想的伟大
原创者。如果这些原创者思想中有一些庸俗成分,他们早就可以做出成百种这样的应用。我时常被问及这样的问题:纯科学与应用科学究竟哪个对世界更重要。为了
应用科学,科学本身必须存在。假如我们停止科学的进步而只留意科学的应用,我们很快就会退化成中国人那样,多少代人以来他们(在科学上)都没有什么进步,
因为他们只满足于科学的应用,却从来没有追问过他们所做事情中的原理。这些原理就构成了纯科学。中国人知道火药的应用已经若干世纪,如果他们用正确的方法
探索其特殊应用的原理,他们就会在获得众多应用的同时发展出化学,甚至物理学。因为只满足于火药能爆炸的事实,而没有寻根问底,中国人已经远远落后于世界
的进步。我们现在只是将这个所有民族中最古老、人口最多的民族当成野蛮人。然而,我们的国家也正处于同样的状况。不过,我们可以做得更好,因为我们获得了
欧洲世界的科学,并将它们应用到生活的方方面面。我们就像接受从天空中落下的雨水那样理所应当地接过这些科学知识,既不问它们究竟从哪里来,也没有感激为
我们提供这些知识的伟大、无私的人们的恩情。就像天堂之雨一样,纯科学降临到我们的国家,让我们的国家更加伟大、富裕和强壮。
The principle of explosion is the law of classical logic and a few other systems (e.g., intuitionistic logic)
according to which "anything follows from a contradiction" - i.e., once
you have asserted a contradiction, you can infer any proposition, or
its converse. In symbolic terms, the principle of explosion can be
expressed in the following way (where "" symbolizes the relation of logical consequence):
This can be read as, "If one claims something is both true (
) and not true (
), one can logically derive any conclusion (ψ)."
The principle of explosion is also known as ex falso quodlibet, ex falso sequitur quodlibet (EFSQ for short), ex contradictione (sequitur) quodlibet (ECQ for short), and ex falso/contradictione (sequitur) (Latin: "from falsehood/contradiction (follows) anything", literally "... what pleases").
The Latin phrase argumentum a fortiori literally means one of the following:
- "from the stronger"
- "even more so"
- "with even stronger reason"
It denotes a proof of a claim by means of an already proved stronger
There are two types of the a fortiori argument:
claim. For example, if it is forbidden to ride a bike with an extra
passenger, then it is also forbidden to ride a bike with two extra
passengers. Or, if one can lift a 100 lb object, then it follows that
one can lift a 50 lb object.
- a maiore ad minus: from bigger to smaller
- a minore ad maius: from smaller to bigger
The a fortiori argument is most often used in order to reinforce a
claim, though sometimes also to incorrectly justify a claim taking it
as a premise (petitio principii).
Reductio ad absurdum (Latin for "reduction to the absurd"), also known as an apagogical argument, reductio ad impossibile, or proof by contradiction, is a type of logical argument
It makes use of the law of non-contradiction — a statement cannot be both true and false. In some cases it may also make use of the law of excluded middle — a statement must be either true or false. The phrase is traceable back to the Greek ἡ εἰς ἄτοπον ἀπαγωγή (hē eis átopon apagōgḗ), meaning "reduction to the absurd", often used by Aristotle.
where one assumes a claim for the sake of argument and derives an
absurd or ridiculous outcome, and then concludes that the original
claim must have been wrong as it led to an absurd result.
An ad hominem argument, also known as argumentum ad hominem (Latin: "argument to the man", "argument against the man") consists of replying to an argument or factual claim by attacking or appealing to a characteristic or belief of the person making the argument or claim, rather than by addressing the substance of the argument or producing evidence against the claim. The process of proving or disproving the claim is thereby subverted, and the argumentum ad hominem works to change the subject.
(3)统计方法的弱点
两位网友多提到计算所的机器翻译系统从规则改为统计后,取得了很大的提高,因此感到规则方法的无效,语言学研究者的无用。但据我所知,也有反例,比如东芝
中国研发中心的王海峰博士,他在东芝主持的机器翻译研究仍是以规则为基础的,他们一直有数名语言学背景的员工在机器翻译第一线工作,今年又新增两位从海外
归来的语言学研究人员。东芝比较低调,但他们的翻译系统是非常出色的,在国际博览会上受到国际学者的充分肯定,在ACL和MTSummit上连续发表文
章。现在的潮流是统计占有优势,因此做基于规则的方法不容易发表论文,但这并不意味着规则方法已经过时。规则是人的智慧的结晶,深刻而灵活,自有它存在的
价值。
短期内评测的成绩不能够决定未来的方向,凡事走到一个极端的时候就会回归了,统计的方法有一些明显的弱点,举例而言,在10万字的语料中你看到了1000
个不同的词,那么当语料扩大一倍,即达到20万字的时候,你可能看到了1200个词,语料增加100%,而新的语言现象可能只增加了20%,当语料庞大到
一定程度,再翻倍增长已经很难,即使翻倍增长,新的语言现象可能已经降到只增加1%以下,油水越来越少了。语言学的作用就是对语言的处理从统计方法所利用
的字词表层推向语法语义深层,每深入一层,就能够大幅度地对语言实例进行归纳,也就能够大幅度地较少对语料库规模和计算规模的无节制的依赖。台湾苏克毅老
师是最早开始从事统计自然语言处理的国际知名学者,但他在演讲中却用一个生动的比喻指出盲目信仰统计方法的可笑之处,他认为停留在语言表层的统计方式方法
是在爬树,尽管目前爬得很高,但机器翻译的目标是登月,完全依靠统计是无法实现机器翻译的目标的。
统计的方法还有一个要穴就是研究者在统计方法面前比较被动,用统计方法作出一套系统,输入一个句子进行测试,如果效果不佳,即使是开发者本人也无法解释其
中的原因,因为所有的参数都是自动计算出来的,人可控的余地很小,只好更换或追加语料库,或者调整统计方法,即使如此能不能修正原先的错误也很难说。于
是,就有人开始打补丁,也就是在统计方法做出结果后,再用一些针对性的规则把一些明显的错误修补一下,这只能说是一种权宜之计,如果换了统计方法,错误类
型也会改变,补丁程序也要跟着换,非常麻烦。