![]() | You are viewing Log in Create a LiveJournal Account Learn more | Explore LJ: Life Entertainment Music Culture News & Politics Technology |
| This Is My Life, Rated | |
| Life: | |
| Mind: | |
| Body: | |
| Spirit: | |
| Friends/Family: | |
| Love: | |
| Finance: | |
| Take the Rate My Life Quiz | |
( S 1.95955e-05以上的一个句子的两种歧义,由于条件概率的乘法公式,其NP和PP的组合歧义无法消除。
( NP 'I' )
( VP 2.61274e-05
( VP 0.001008
( V 'saw' )
( NP 0.00168
( NP 'John' )
( PP 0.0336
( P 'with' )
( NP 0.056
( Det 'a' )
( N 'dog' ) ) ) ) )
( PP 0.0864
( P 'with' )
( NP 0.216
( Det 'my' )
( N 'cookie' ) ) ) ) )
( S 1.30637e-05
( NP 'I' )
( VP 1.74182e-05
( V 'saw' )
( NP 2.90304e-05
( NP 0.00168
( NP 'John' )
( PP 0.0336
( P 'with' )
( NP 0.056
( Det 'a' )
( N 'dog' ) ) ) )
( PP 0.0864
( P 'with' )
( NP 0.216
( Det 'my' )
( N 'cookie' ) ) ) ) ) )
( S 1.95955e-05
( NP 'I' )
( VP 2.61274e-05
( VP 0.15
( V 'saw' )
( NP 'John' ) )
( PP 0.000580608
( P 'with' )
( NP 0.00096768
( NP 0.056
( Det 'a' )
( N 'dog' ) )
( PP 0.0864
( P 'with' )
( NP 0.216
( Det 'my' )
( N 'cookie' ) ) ) ) ) ) )
( S 1.30637e-05
( NP 'I' )
( VP 1.74182e-05
( V 'saw' )
( NP 2.90304e-05
( NP 'John' )
( PP 0.000580608
( P 'with' )
( NP 0.00096768
( NP 0.056
( Det 'a' )
( N 'dog' ) )
( PP 0.0864
( P 'with' )
( NP 0.216
( Det 'my' )
( N 'cookie' ) ) ) ) ) ) ) )
美国的科学只存在未来,它没有今天和过去。在我这个位置上的人应该思考的问题是:我们必须要做些什么才能创造出我国的物理学,而不是把电报机、电灯和其它
的便利设施称之为科学。我并不是想低估所有这些东西的价值,世界的进步需要依靠它们,成功发明这些东西的人应该受到世界的尊重。但是,虽然一位厨师发明了
餐桌上的一道新鲜的美味佳肴,使世人在某种程度上享受到了口福,但是,我们并不会尊称他为化学家。但是,人们将应用科学与纯科学混为一谈并不是罕见之事,
特别是在美国的报纸上。一些卑微的美国人偷取过去伟大人物的思想,通过这些思想在日常生活中的应用让自己富裕,他们得到的赞美高于那些提出这些思想的伟大
原创者。如果这些原创者思想中有一些庸俗成分,他们早就可以做出成百种这样的应用。我时常被问及这样的问题:纯科学与应用科学究竟哪个对世界更重要。为了
应用科学,科学本身必须存在。假如我们停止科学的进步而只留意科学的应用,我们很快就会退化成中国人那样,多少代人以来他们(在科学上)都没有什么进步,
因为他们只满足于科学的应用,却从来没有追问过他们所做事情中的原理。这些原理就构成了纯科学。中国人知道火药的应用已经若干世纪,如果他们用正确的方法
探索其特殊应用的原理,他们就会在获得众多应用的同时发展出化学,甚至物理学。因为只满足于火药能爆炸的事实,而没有寻根问底,中国人已经远远落后于世界
的进步。我们现在只是将这个所有民族中最古老、人口最多的民族当成野蛮人。然而,我们的国家也正处于同样的状况。不过,我们可以做得更好,因为我们获得了
欧洲世界的科学,并将它们应用到生活的方方面面。我们就像接受从天空中落下的雨水那样理所应当地接过这些科学知识,既不问它们究竟从哪里来,也没有感激为
我们提供这些知识的伟大、无私的人们的恩情。就像天堂之雨一样,纯科学降临到我们的国家,让我们的国家更加伟大、富裕和强壮。
The principle of explosion is the law of classical logic and a few other systems (e.g., intuitionistic logic)
according to which "anything follows from a contradiction" - i.e., once
you have asserted a contradiction, you can infer any proposition, or
its converse. In symbolic terms, the principle of explosion can be
expressed in the following way (where "" symbolizes the relation of logical consequence):
This can be read as, "If one claims something is both true (
) and not true (
), one can logically derive any conclusion (ψ)."
The principle of explosion is also known as ex falso quodlibet, ex falso sequitur quodlibet (EFSQ for short), ex contradictione (sequitur) quodlibet (ECQ for short), and ex falso/contradictione (sequitur) (Latin: "from falsehood/contradiction (follows) anything", literally "... what pleases").
The Latin phrase argumentum a fortiori literally means one of the following:
- "from the stronger"
- "even more so"
- "with even stronger reason"
It denotes a proof of a claim by means of an already proved stronger
There are two types of the a fortiori argument:
claim. For example, if it is forbidden to ride a bike with an extra
passenger, then it is also forbidden to ride a bike with two extra
passengers. Or, if one can lift a 100 lb object, then it follows that
one can lift a 50 lb object.
- a maiore ad minus: from bigger to smaller
- a minore ad maius: from smaller to bigger
The a fortiori argument is most often used in order to reinforce a
claim, though sometimes also to incorrectly justify a claim taking it
as a premise (petitio principii).
Reductio ad absurdum (Latin for "reduction to the absurd"), also known as an apagogical argument, reductio ad impossibile, or proof by contradiction, is a type of logical argument
It makes use of the law of non-contradiction — a statement cannot be both true and false. In some cases it may also make use of the law of excluded middle — a statement must be either true or false. The phrase is traceable back to the Greek ἡ εἰς ἄτοπον ἀπαγωγή (hē eis átopon apagōgḗ), meaning "reduction to the absurd", often used by Aristotle.
where one assumes a claim for the sake of argument and derives an
absurd or ridiculous outcome, and then concludes that the original
claim must have been wrong as it led to an absurd result.
An ad hominem argument, also known as argumentum ad hominem (Latin: "argument to the man", "argument against the man") consists of replying to an argument or factual claim by attacking or appealing to a characteristic or belief of the person making the argument or claim, rather than by addressing the substance of the argument or producing evidence against the claim. The process of proving or disproving the claim is thereby subverted, and the argumentum ad hominem works to change the subject.
(3)统计方法的弱点
两位网友多提到计算所的机器翻译系统从规则改为统计后,取得了很大的提高,因此感到规则方法的无效,语言学研究者的无用。但据我所知,也有反例,比如东芝
中国研发中心的王海峰博士,他在东芝主持的机器翻译研究仍是以规则为基础的,他们一直有数名语言学背景的员工在机器翻译第一线工作,今年又新增两位从海外
归来的语言学研究人员。东芝比较低调,但他们的翻译系统是非常出色的,在国际博览会上受到国际学者的充分肯定,在ACL和MTSummit上连续发表文
章。现在的潮流是统计占有优势,因此做基于规则的方法不容易发表论文,但这并不意味着规则方法已经过时。规则是人的智慧的结晶,深刻而灵活,自有它存在的
价值。
短期内评测的成绩不能够决定未来的方向,凡事走到一个极端的时候就会回归了,统计的方法有一些明显的弱点,举例而言,在10万字的语料中你看到了1000
个不同的词,那么当语料扩大一倍,即达到20万字的时候,你可能看到了1200个词,语料增加100%,而新的语言现象可能只增加了20%,当语料庞大到
一定程度,再翻倍增长已经很难,即使翻倍增长,新的语言现象可能已经降到只增加1%以下,油水越来越少了。语言学的作用就是对语言的处理从统计方法所利用
的字词表层推向语法语义深层,每深入一层,就能够大幅度地对语言实例进行归纳,也就能够大幅度地较少对语料库规模和计算规模的无节制的依赖。台湾苏克毅老
师是最早开始从事统计自然语言处理的国际知名学者,但他在演讲中却用一个生动的比喻指出盲目信仰统计方法的可笑之处,他认为停留在语言表层的统计方式方法
是在爬树,尽管目前爬得很高,但机器翻译的目标是登月,完全依靠统计是无法实现机器翻译的目标的。
统计的方法还有一个要穴就是研究者在统计方法面前比较被动,用统计方法作出一套系统,输入一个句子进行测试,如果效果不佳,即使是开发者本人也无法解释其
中的原因,因为所有的参数都是自动计算出来的,人可控的余地很小,只好更换或追加语料库,或者调整统计方法,即使如此能不能修正原先的错误也很难说。于
是,就有人开始打补丁,也就是在统计方法做出结果后,再用一些针对性的规则把一些明显的错误修补一下,这只能说是一种权宜之计,如果换了统计方法,错误类
型也会改变,补丁程序也要跟着换,非常麻烦。
给定一个概率分布D,假定其概率密度函数(连续分布)或概率聚集函数(离散分布)为fD,以及一个分布参数θ,我们可以从这个分布中抽出一个具有n个值的采样
,通过利用fD,我们就能计算出其概率:

但是,我们可能不知道θ的值,尽管我们知道这些采样数据来自于分布D。那么我们如何才能估计出θ呢? 一个自然的想法是从这个分布中抽出一个具有n个值的采样X1,X2,...,Xn,然后用这些采样数据来估计θ.
一旦我们获得
, 我们就能从中找到一个关于θ的估计。最大似然估计会寻找关于 θ的最可能的值(即,在所有可能的θ取值中,寻找一个值使这个采样的“可能性”最大化)。这种方法正好同一些其他的估计方
要在数学上实现最大似然估计法,我们首先要定义可能性:

并且在θ的所有取值上,使这个函数最大化。这个使可能性最大的
值即被称为θ的最大似然估计。
广义化(英文:Generalize),又称一般化、通常化、普遍化、概化,是指将事
物的定义进行修改或者补充以使其适用于更加大的范围。 一个将事物广义化的简单例子是归类。例如:将“大雁”广义化(归类)之后是“鸟类”,将“鸟
类”广义化(归类)之后是“动物”。 当然,这样的定义并不严谨。
从逻辑学的角度来定义,只有满足下面两个条件才能说,“A 是广义化之后的 B”,或者“ A 是广义上的 B”。条件如下:
就之前的例子,因为每只“大雁”(B)都是“鸟”(A),但是“鸟类”并不一定是“大
雁”,所以我们可以说:“鸟类”是广义上的“大雁”。
首先讲一下什么是overlapping
subproblems。它是指可以被分解成若干次重用的子问题的那类问题。例如Fi
sequence(斐波纳契数列,每个数等于前两个数的和,其中fib(0) =
1且fib(1) = 1)。对于overlapping
subproblems,天真的算法可能重复计算某些子问题,浪费时间。而dynam
programming使用memoization来解决这个问题,即把计算的结果保存起来,需要的时候取出使用即可。
那么什么是optimal
substructure呢?如果可以从其子问题的最优解构造出该问题的最优解,则该
substructure属性。据有optimal
substructure的问题适合用动态规划和贪心算法求解。例子是寻找一个图中两个顶点间的最短路径,先找到从开始点的所有邻居到目标的最
通常我们可以用三个步骤对具有optimal
substructure属性的问题求解:
综上,dynamic programming使用了三种技术:overlapping
subproblems, optimal substructure and memoization.
动态规划通常采取两种方法: top-down
approach(合并了recursion和memoization)和botto
approach(性能稍好,但很难直观地列出所有子问题).
dynamic programming是由Richard
Bellman在1940s提出的。bellman的主要贡献是Bellman equation,aka,
dynamic programming equation.是dynamic
programming最优性的必要条件。
贪心算法的特点:每一阶段都追求局部最优,希望最终达到全局最优。
贪心算法能对具有两种属性的问题工作的很好:greedy choice
property和optimal substructure.
optimal substructure在上面已经介绍过,greedy choice
property是指在做每一步的选择时不需要和以前的选择一起考虑。
贪心算法不会回溯以前的选择,这是和动态规划的主要不同。
,A,B).
![]() |
the vector of the initial state probabilities; | ||
![]() |
the state transition matrix; | ![]() |
|
![]() |
the confusion matrix; | ![]() |
struct Q_CORE_EXPORT QListData {可以看出其访问指针的存储是由一段连续的内存空间组成的,而不同元素之间的空间却不连
struct Data {
QBasicAtomic ref;
int alloc, begin, end;
uint sharable : 1;
void *array[1];
};
。。。
Data *d;
。。。
inline int size() const { return d->end - d->begin; }
inline bool isEmpty() const { return d->end == d->begin; }
inline void **at(int i) const { return d->array + d->begin + i; }
inline void **begin() const { return d->array + d->begin; }
inline void **end() const { return d->array + d->end; }
};