1 | <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> |
---|
2 | <html><!--This page is automatically generated. Do not edit!--> |
---|
3 | <head> |
---|
4 | <META http-equiv="Content-Type" content="text/html; charset=UTF-8"> |
---|
5 | <title>Nutch: 简介</title> |
---|
6 | <style type="text/css"> |
---|
7 | |
---|
8 | .menuTd { |
---|
9 | background-color: #F9F7F4; |
---|
10 | height: 25px; |
---|
11 | } |
---|
12 | |
---|
13 | .menuTdhover { |
---|
14 | background-color: #ECE5DC; |
---|
15 | height: 25px; |
---|
16 | } |
---|
17 | |
---|
18 | .menuEntry { |
---|
19 | font-family: Arial, Helvetica, sans-serif; |
---|
20 | font-size: 12px; |
---|
21 | color: #000000; |
---|
22 | text-decoration: none; |
---|
23 | } |
---|
24 | |
---|
25 | .body { |
---|
26 | background-color: #F9F7F4; |
---|
27 | } |
---|
28 | |
---|
29 | .bodytext { |
---|
30 | font-family: Arial, Helvetica, sans-serif; |
---|
31 | font-size: 12px; |
---|
32 | color: #000000; |
---|
33 | text-decoration: none; |
---|
34 | } |
---|
35 | |
---|
36 | .title { |
---|
37 | font-family: Arial, Helvetica, sans-serif; |
---|
38 | font-size: 26px; |
---|
39 | color: #FF9900; |
---|
40 | text-decoration: none; |
---|
41 | } |
---|
42 | |
---|
43 | .intro { |
---|
44 | font-family: Arial, Helvetica, sans-serif; |
---|
45 | font-size: 12px; |
---|
46 | color: #FF9900; |
---|
47 | text-decoration: none; |
---|
48 | } |
---|
49 | |
---|
50 | .orangeTd { |
---|
51 | background-color: #FF9900 |
---|
52 | } |
---|
53 | |
---|
54 | ul { |
---|
55 | list-style-image: url(../img/reiter/ul.gif) |
---|
56 | } |
---|
57 | |
---|
58 | h3 { |
---|
59 | font-family: Arial, Helvetica, sans-serif; |
---|
60 | font-size: 16px; |
---|
61 | color: #000000; |
---|
62 | } |
---|
63 | |
---|
64 | h4 { |
---|
65 | font-family: Arial, Helvetica, sans-serif; |
---|
66 | font-size: 14px; |
---|
67 | color: #000000; |
---|
68 | } |
---|
69 | |
---|
70 | .url { |
---|
71 | color: #996600; |
---|
72 | } |
---|
73 | |
---|
74 | .highlight { |
---|
75 | font-weight: bold; |
---|
76 | } |
---|
77 | |
---|
78 | .ellipsis { |
---|
79 | font-weight: bold; |
---|
80 | } |
---|
81 | |
---|
82 | </style> |
---|
83 | <link rel="icon" href="../img/favicon.ico" type="image/x-icon"> |
---|
84 | <link rel="shortcut icon" href="../img/favicon.ico" type="image/x-icon"> |
---|
85 | <script type="text/javascript"> |
---|
86 | <!-- |
---|
87 | function queryfocus() { |
---|
88 | search = document.search; |
---|
89 | if (search != null) { search.query.focus(); } |
---|
90 | } |
---|
91 | // --></script> |
---|
92 | </head> |
---|
93 | <body onLoad="queryfocus();"> |
---|
94 | <!--This file is automatically generated. Do not edit!--> |
---|
95 | <table width="635" border="0" cellpadding="0" cellspacing="0"> |
---|
96 | <tr> |
---|
97 | <td valign="bottom" width="140" rowspan="2"><a href="./"><img src="../img/reiter/logo_nutch.gif" border="0"></a><img src="../img/reiter/spacer_666666.gif" width="140" height="1"></td> |
---|
98 | </tr> |
---|
99 | <tr> |
---|
100 | <td width="495" valign="bottom" align="right"> |
---|
101 | <table border="0" cellpadding="0" cellspacing="0" width="495"> |
---|
102 | <tr> |
---|
103 | <td background="../img/reiter/_bg_reiter.gif" width="400"> </td><td height="28" valign="bottom" width="10"><img src="../img/reiter/reiter_inactive_le1.gif" border="0"></td><td background="../img/reiter/_bg_reiter_inactive.gif" valign="bottom" nowrap="nowrap"><a class="bodytext" href="about.html">简介</a></td><td height="28" valign="bottom" width="10"><img src="../img/reiter/reiter_inactive_ri.gif" border="0"></td><td height="28" valign="bottom" width="10"><img src="../img/reiter/reiter_inactive_le.gif" border="0"></td><td background="../img/reiter/_bg_reiter_inactive.gif" valign="bottom" nowrap="nowrap"><a class="bodytext" href="http://wiki.apache.org/nutch/FAQ">常见问题</a></td><td height="28" valign="bottom" width="10"><img src="../img/reiter/reiter_inactive_ri.gif" border="0"></td> |
---|
104 | </tr> |
---|
105 | </table> |
---|
106 | </td> |
---|
107 | </tr> |
---|
108 | </table> |
---|
109 | <table width="635" border="0" cellpadding="0" cellspacing="0"> |
---|
110 | <tr valign="top"> |
---|
111 | <td width="140"> |
---|
112 | <table width="100%" cellpadding="0" cellspacing="0"> |
---|
113 | <tr class="menuTd" height="25"> |
---|
114 | <td class="menuTd" onmouseover="this.className='menuTdhover';" onmouseout="this.className='menuTd'" width="100%"> :: <a href="http://lucene.apache.org/nutch/credits.html" class="menuEntry">参与人员</a></td> |
---|
115 | </tr> |
---|
116 | <tr height="1px"> |
---|
117 | <td><img src="../img/reiter/spacer_666666.gif" height="1" width="100%"></td> |
---|
118 | </tr> |
---|
119 | <tr class="menuTd" height="25"> |
---|
120 | <td class="menuTd" onmouseover="this.className='menuTdhover';" onmouseout="this.className='menuTd'" width="100%"> :: <a href="http://lucene.apache.org/nutch/index.html" class="menuEntry">当前状态</a></td> |
---|
121 | </tr> |
---|
122 | <tr height="1px"> |
---|
123 | <td><img src="../img/reiter/spacer_666666.gif" height="1" width="100%"></td> |
---|
124 | </tr> |
---|
125 | <tr> |
---|
126 | <td> </td> |
---|
127 | </tr> |
---|
128 | </table> |
---|
129 | </td><td width="20" background="../img/reiter/_spacer_cccccc.gif"> </td><td width="475" class="body"> |
---|
130 | <table width="475" border="0" cellpadding="0" cellspacing="0"> |
---|
131 | <tr> |
---|
132 | <td class="title" height="125" width="275" valign="bottom">简介</td><td height="125" width="200" valign="bottom"><img src="../img/reiter/robots.gif"></td> |
---|
133 | </tr> |
---|
134 | </table> |
---|
135 | <br class="br"> |
---|
136 | <span class="bodytext"> |
---|
137 | |
---|
138 | |
---|
139 | </span><span class="intro"> |
---|
140 | <p>Nutch 是一个刚刚诞生开放源代码(open-source)的web搜索引擎.</p> |
---|
141 | </span><span class="bodytext"> |
---|
142 | |
---|
143 | |
---|
144 | </span><span class="bodytext"> |
---|
145 | <p> 尽管Web搜索是漫游Internet的基本要求, 但是现有web搜索引擎的数目却在下降. |
---|
146 | 并且这很有可能进一步演变成为一个公司垄断了几乎所有的web搜索为其谋取商业利益.这显然 |
---|
147 | 不利于广大Internet用户.</p> |
---|
148 | </span><span class="bodytext"> |
---|
149 | |
---|
150 | </span><span class="bodytext"> |
---|
151 | <p> Nutch为我们提供了这样一个不同的选择. 相对于那些商用的搜索引擎, Nutch作为开放源代码 |
---|
152 | 搜索引擎将会更加透明, 从而更值得大家信赖. 现在所有主要的搜索引擎都采用私有的排序算法, |
---|
153 | 而不会解释为什么一个网页会排在一个特定的位置. 除此之外, 有的搜索引擎依照网站所付的 |
---|
154 | 费用, 而不是根据它们本身的价值进行排序. 与它们不同, Nucth没有什么需要隐瞒, 也没有 |
---|
155 | 动机去扭曲搜索的结果. Nutch将尽自己最大的努力为用户提供最好的搜索结果.</p> |
---|
156 | </span><span class="bodytext"> |
---|
157 | |
---|
158 | |
---|
159 | </span><span class="bodytext"> |
---|
160 | <p>Nutch 致力于让每个人能很容易, 同时花费很少就可以配置世界一流的Web搜索引擎. |
---|
161 | 为了完成这一宏伟的目标, Nutch必须能够做到:</p> |
---|
162 | </span><span class="bodytext"> |
---|
163 | |
---|
164 | </span><span class="bodytext"> |
---|
165 | <ul> |
---|
166 | |
---|
167 | <li>每个月取几十亿网页</li> |
---|
168 | |
---|
169 | <li>为这些网页维护一个索引</li> |
---|
170 | |
---|
171 | <li>对索引文件进行每秒上千次的搜索</li> |
---|
172 | |
---|
173 | <li>提供高质量的搜索结果</li> |
---|
174 | |
---|
175 | <li>以最小的成本运作</li> |
---|
176 | |
---|
177 | </ul> |
---|
178 | </span><span class="bodytext"> |
---|
179 | |
---|
180 | </span><span class="bodytext"> |
---|
181 | <p> 这是一个巨大的挑战. 如果你相信它的价值, 请伸出你的援手. 你可以 |
---|
182 | 参与<a href="http://www.apache.org/dev/">开发</a>, 或是提供<a href="http://www.apache.org/foundation/contributing.html">捐赠</a>. </p> |
---|
183 | </span><span class="bodytext"> |
---|
184 | |
---|
185 | </span> |
---|
186 | <br class="br"> |
---|
187 | <br class="br"> |
---|
188 | </td> |
---|
189 | </tr> |
---|
190 | </table> |
---|
191 | <table width="635" border="0" cellpadding="0" cellspacing="0"> |
---|
192 | |
---|
193 | <tr> |
---|
194 | |
---|
195 | <td width="140"> </td> |
---|
196 | <td width="20"> </td> |
---|
197 | <td width="475" align="center"> |
---|
198 | <span class="bodytext"> |
---|
199 | |
---|
200 | <br> |
---|
201 | |
---|
202 | <a href="../ca/">ca</a> | |
---|
203 | <a href="../de/">de</a> | |
---|
204 | <a href="../en/">en</a> | |
---|
205 | <a href="../es/">es</a> | |
---|
206 | <a href="../fi/">fi</a> | |
---|
207 | <a href="../fr/">fr</a> | |
---|
208 | <a href="../hu/">hu</a> | |
---|
209 | <a href="../it/">it</a> | |
---|
210 | <a href="../jp/">jp</a> | |
---|
211 | <a href="../ms/">ms</a> | |
---|
212 | <a href="../nl/">nl</a> | |
---|
213 | <a href="../pl/">pl</a> | |
---|
214 | <a href="../pt/">pt</a> | |
---|
215 | <a href="../sh/">sh</a> | |
---|
216 | <a href="../sr/">sr</a> | |
---|
217 | <a href="../sv/">sv</a> | |
---|
218 | <a href="../th/">th</a> | |
---|
219 | <a href="../zh/">zh</a> |
---|
220 | </span> |
---|
221 | </td> |
---|
222 | |
---|
223 | </tr> |
---|
224 | |
---|
225 | <tr> |
---|
226 | |
---|
227 | </tr> |
---|
228 | |
---|
229 | </table> |
---|
230 | </body> |
---|
231 | </html> |
---|