[66] | 1 | <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> |
---|
| 2 | <html><!--This page is automatically generated. Do not edit!--> |
---|
| 3 | <head> |
---|
| 4 | <META http-equiv="Content-Type" content="text/html; charset=UTF-8"> |
---|
| 5 | <title>Nutch: 简介</title> |
---|
| 6 | <style type="text/css"> |
---|
| 7 | |
---|
| 8 | .menuTd { |
---|
| 9 | background-color: #F9F7F4; |
---|
| 10 | height: 25px; |
---|
| 11 | } |
---|
| 12 | |
---|
| 13 | .menuTdhover { |
---|
| 14 | background-color: #ECE5DC; |
---|
| 15 | height: 25px; |
---|
| 16 | } |
---|
| 17 | |
---|
| 18 | .menuEntry { |
---|
| 19 | font-family: Arial, Helvetica, sans-serif; |
---|
| 20 | font-size: 12px; |
---|
| 21 | color: #000000; |
---|
| 22 | text-decoration: none; |
---|
| 23 | } |
---|
| 24 | |
---|
| 25 | .body { |
---|
| 26 | background-color: #F9F7F4; |
---|
| 27 | } |
---|
| 28 | |
---|
| 29 | .bodytext { |
---|
| 30 | font-family: Arial, Helvetica, sans-serif; |
---|
| 31 | font-size: 12px; |
---|
| 32 | color: #000000; |
---|
| 33 | text-decoration: none; |
---|
| 34 | } |
---|
| 35 | |
---|
| 36 | .title { |
---|
| 37 | font-family: Arial, Helvetica, sans-serif; |
---|
| 38 | font-size: 26px; |
---|
| 39 | color: #FF9900; |
---|
| 40 | text-decoration: none; |
---|
| 41 | } |
---|
| 42 | |
---|
| 43 | .intro { |
---|
| 44 | font-family: Arial, Helvetica, sans-serif; |
---|
| 45 | font-size: 12px; |
---|
| 46 | color: #FF9900; |
---|
| 47 | text-decoration: none; |
---|
| 48 | } |
---|
| 49 | |
---|
| 50 | .orangeTd { |
---|
| 51 | background-color: #FF9900 |
---|
| 52 | } |
---|
| 53 | |
---|
| 54 | ul { |
---|
| 55 | list-style-image: url(../img/reiter/ul.gif) |
---|
| 56 | } |
---|
| 57 | |
---|
| 58 | h3 { |
---|
| 59 | font-family: Arial, Helvetica, sans-serif; |
---|
| 60 | font-size: 16px; |
---|
| 61 | color: #000000; |
---|
| 62 | } |
---|
| 63 | |
---|
| 64 | h4 { |
---|
| 65 | font-family: Arial, Helvetica, sans-serif; |
---|
| 66 | font-size: 14px; |
---|
| 67 | color: #000000; |
---|
| 68 | } |
---|
| 69 | |
---|
| 70 | .url { |
---|
| 71 | color: #996600; |
---|
| 72 | } |
---|
| 73 | |
---|
| 74 | .highlight { |
---|
| 75 | font-weight: bold; |
---|
| 76 | } |
---|
| 77 | |
---|
| 78 | .ellipsis { |
---|
| 79 | font-weight: bold; |
---|
| 80 | } |
---|
| 81 | |
---|
| 82 | </style> |
---|
| 83 | <link rel="icon" href="../img/favicon.ico" type="image/x-icon"> |
---|
| 84 | <link rel="shortcut icon" href="../img/favicon.ico" type="image/x-icon"> |
---|
| 85 | <script type="text/javascript"> |
---|
| 86 | <!-- |
---|
| 87 | function queryfocus() { |
---|
| 88 | search = document.search; |
---|
| 89 | if (search != null) { search.query.focus(); } |
---|
| 90 | } |
---|
| 91 | // --></script> |
---|
| 92 | </head> |
---|
| 93 | <body onLoad="queryfocus();"> |
---|
| 94 | <!--This file is automatically generated. Do not edit!--> |
---|
| 95 | <table width="635" border="0" cellpadding="0" cellspacing="0"> |
---|
| 96 | <tr> |
---|
| 97 | <td valign="bottom" width="140" rowspan="2"><a href="./"><img src="../img/reiter/logo_nutch.gif" border="0"></a><img src="../img/reiter/spacer_666666.gif" width="140" height="1"></td> |
---|
| 98 | </tr> |
---|
| 99 | <tr> |
---|
| 100 | <td width="495" valign="bottom" align="right"> |
---|
| 101 | <table border="0" cellpadding="0" cellspacing="0" width="495"> |
---|
| 102 | <tr> |
---|
| 103 | <td background="../img/reiter/_bg_reiter.gif" width="400"> </td><td height="28" valign="bottom" width="10"><img src="../img/reiter/reiter_inactive_le1.gif" border="0"></td><td background="../img/reiter/_bg_reiter_inactive.gif" valign="bottom" nowrap="nowrap"><a class="bodytext" href="about.html">简介</a></td><td height="28" valign="bottom" width="10"><img src="../img/reiter/reiter_inactive_ri.gif" border="0"></td><td height="28" valign="bottom" width="10"><img src="../img/reiter/reiter_inactive_le.gif" border="0"></td><td background="../img/reiter/_bg_reiter_inactive.gif" valign="bottom" nowrap="nowrap"><a class="bodytext" href="http://wiki.apache.org/nutch/FAQ">常见问题</a></td><td height="28" valign="bottom" width="10"><img src="../img/reiter/reiter_inactive_ri.gif" border="0"></td> |
---|
| 104 | </tr> |
---|
| 105 | </table> |
---|
| 106 | </td> |
---|
| 107 | </tr> |
---|
| 108 | </table> |
---|
| 109 | <table width="635" border="0" cellpadding="0" cellspacing="0"> |
---|
| 110 | <tr valign="top"> |
---|
| 111 | <td width="140"> |
---|
| 112 | <table width="100%" cellpadding="0" cellspacing="0"> |
---|
| 113 | <tr class="menuTd" height="25"> |
---|
| 114 | <td class="menuTd" onmouseover="this.className='menuTdhover';" onmouseout="this.className='menuTd'" width="100%"> :: <a href="http://lucene.apache.org/nutch/credits.html" class="menuEntry">参与人员</a></td> |
---|
| 115 | </tr> |
---|
| 116 | <tr height="1px"> |
---|
| 117 | <td><img src="../img/reiter/spacer_666666.gif" height="1" width="100%"></td> |
---|
| 118 | </tr> |
---|
| 119 | <tr class="menuTd" height="25"> |
---|
| 120 | <td class="menuTd" onmouseover="this.className='menuTdhover';" onmouseout="this.className='menuTd'" width="100%"> :: <a href="http://lucene.apache.org/nutch/index.html" class="menuEntry">当前状态</a></td> |
---|
| 121 | </tr> |
---|
| 122 | <tr height="1px"> |
---|
| 123 | <td><img src="../img/reiter/spacer_666666.gif" height="1" width="100%"></td> |
---|
| 124 | </tr> |
---|
| 125 | <tr> |
---|
| 126 | <td> </td> |
---|
| 127 | </tr> |
---|
| 128 | </table> |
---|
| 129 | </td><td width="20" background="../img/reiter/_spacer_cccccc.gif"> </td><td width="475" class="body"> |
---|
| 130 | <table width="475" border="0" cellpadding="0" cellspacing="0"> |
---|
| 131 | <tr> |
---|
| 132 | <td class="title" height="125" width="275" valign="bottom">简介</td><td height="125" width="200" valign="bottom"><img src="../img/reiter/robots.gif"></td> |
---|
| 133 | </tr> |
---|
| 134 | </table> |
---|
| 135 | <br class="br"> |
---|
| 136 | <span class="bodytext"> |
---|
| 137 | |
---|
| 138 | |
---|
| 139 | </span><span class="intro"> |
---|
| 140 | <p>Nutch 是一个刚刚诞生开放源代码(open-source)的web搜索引擎.</p> |
---|
| 141 | </span><span class="bodytext"> |
---|
| 142 | |
---|
| 143 | |
---|
| 144 | </span><span class="bodytext"> |
---|
| 145 | <p> 尽管Web搜索是漫游Internet的基本要求, 但是现有web搜索引擎的数目却在下降. |
---|
| 146 | 并且这很有可能进一步演变成为一个公司垄断了几乎所有的web搜索为其谋取商业利益.这显然 |
---|
| 147 | 不利于广大Internet用户.</p> |
---|
| 148 | </span><span class="bodytext"> |
---|
| 149 | |
---|
| 150 | </span><span class="bodytext"> |
---|
| 151 | <p> Nutch为我们提供了这样一个不同的选择. 相对于那些商用的搜索引擎, Nutch作为开放源代码 |
---|
| 152 | 搜索引擎将会更加透明, 从而更值得大家信赖. 现在所有主要的搜索引擎都采用私有的排序算法, |
---|
| 153 | 而不会解释为什么一个网页会排在一个特定的位置. 除此之外, 有的搜索引擎依照网站所付的 |
---|
| 154 | 费用, 而不是根据它们本身的价值进行排序. 与它们不同, Nucth没有什么需要隐瞒, 也没有 |
---|
| 155 | 动机去扭曲搜索的结果. Nutch将尽自己最大的努力为用户提供最好的搜索结果.</p> |
---|
| 156 | </span><span class="bodytext"> |
---|
| 157 | |
---|
| 158 | |
---|
| 159 | </span><span class="bodytext"> |
---|
| 160 | <p>Nutch 致力于让每个人能很容易, 同时花费很少就可以配置世界一流的Web搜索引擎. |
---|
| 161 | 为了完成这一宏伟的目标, Nutch必须能够做到:</p> |
---|
| 162 | </span><span class="bodytext"> |
---|
| 163 | |
---|
| 164 | </span><span class="bodytext"> |
---|
| 165 | <ul> |
---|
| 166 | |
---|
| 167 | <li>每个月取几十亿网页</li> |
---|
| 168 | |
---|
| 169 | <li>为这些网页维护一个索引</li> |
---|
| 170 | |
---|
| 171 | <li>对索引文件进行每秒上千次的搜索</li> |
---|
| 172 | |
---|
| 173 | <li>提供高质量的搜索结果</li> |
---|
| 174 | |
---|
| 175 | <li>以最小的成本运作</li> |
---|
| 176 | |
---|
| 177 | </ul> |
---|
| 178 | </span><span class="bodytext"> |
---|
| 179 | |
---|
| 180 | </span><span class="bodytext"> |
---|
| 181 | <p> 这是一个巨大的挑战. 如果你相信它的价值, 请伸出你的援手. 你可以 |
---|
| 182 | 参与<a href="http://www.apache.org/dev/">开发</a>, 或是提供<a href="http://www.apache.org/foundation/contributing.html">捐赠</a>. </p> |
---|
| 183 | </span><span class="bodytext"> |
---|
| 184 | |
---|
| 185 | </span> |
---|
| 186 | <br class="br"> |
---|
| 187 | <br class="br"> |
---|
| 188 | </td> |
---|
| 189 | </tr> |
---|
| 190 | </table> |
---|
| 191 | <table width="635" border="0" cellpadding="0" cellspacing="0"> |
---|
| 192 | |
---|
| 193 | <tr> |
---|
| 194 | |
---|
| 195 | <td width="140"> </td> |
---|
| 196 | <td width="20"> </td> |
---|
| 197 | <td width="475" align="center"> |
---|
| 198 | <span class="bodytext"> |
---|
| 199 | |
---|
| 200 | <br> |
---|
| 201 | |
---|
| 202 | <a href="../ca/">ca</a> | |
---|
| 203 | <a href="../de/">de</a> | |
---|
| 204 | <a href="../en/">en</a> | |
---|
| 205 | <a href="../es/">es</a> | |
---|
| 206 | <a href="../fi/">fi</a> | |
---|
| 207 | <a href="../fr/">fr</a> | |
---|
| 208 | <a href="../hu/">hu</a> | |
---|
| 209 | <a href="../it/">it</a> | |
---|
| 210 | <a href="../jp/">jp</a> | |
---|
| 211 | <a href="../ms/">ms</a> | |
---|
| 212 | <a href="../nl/">nl</a> | |
---|
| 213 | <a href="../pl/">pl</a> | |
---|
| 214 | <a href="../pt/">pt</a> | |
---|
| 215 | <a href="../sh/">sh</a> | |
---|
| 216 | <a href="../sr/">sr</a> | |
---|
| 217 | <a href="../sv/">sv</a> | |
---|
| 218 | <a href="../th/">th</a> | |
---|
| 219 | <a href="../zh/">zh</a> |
---|
| 220 | </span> |
---|
| 221 | </td> |
---|
| 222 | |
---|
| 223 | </tr> |
---|
| 224 | |
---|
| 225 | <tr> |
---|
| 226 | |
---|
| 227 | </tr> |
---|
| 228 | |
---|
| 229 | </table> |
---|
| 230 | </body> |
---|
| 231 | </html> |
---|