Thứ Năm, 27 tháng 2, 2014

Tìm những trò vớ vẩn trên net

Website: http://www.docs.vn Email : lienhe@docs.vn Tel (: 0918.775.368
Tìm những trò vớ vẩn trên net
Hỏi Archie
Trong chương này
 Tìm file theo tên
 Login vào Archie
 Gởi một lá thư cho Archie
Tôi biết là tôi đã thấy một ghi chú về nó ở đâu đây thôi
Có lẽ ở đâu đó trên Internet có đủ các thứ bạn muốn và nhiều hơn thế nữa
nếu bạn biết là nó tồn tại. "Nhưng làm thế nào tìm ra nó?", bạn hỏi. Một câu hỏi
hay.
Nếu bạn đang tìm phần mềm, hãy hỏi Archie.
Nếu bạn biết tên của những gì bạn tìm - hoặc biết đại loại đủ để đoán một
cách hợp lý - Archie sẽ đi vòng quanh thế giới, kiểm tra hết cơ sở dữ liệu này đến
cơ sở dữ liệu khác, tìm ra các file khớp với mô tả của bạn.
Các server Archie có trên khắp thế giới, nhưng bạn nên chọn một cái gần
nhà để tối thiểu hoá giao thông trên Net. Những server Archie khác nhau được sử
dụng nhiều ít khác nhau, nên bạn hãy thử một vài trong số đó để chọn một cái với
thời gian trả lời hợp lý. Nếu tất cả đều quá chậm, hãy thử làm vào sáng sớm, hoặc
tối khuya, hoặc gởi yêu cầu đến Archie qua email (xem phần "Archie email" trong
phần sau của chương này).
Bảng 19-1 liệt kê nhiều server Archie mà bạn có thể thử. Nếu bạn thử một
archie, và nó không cho bạn vào vì nó đầy quá, có thể nó sẽ cho bạn một danh sách
các Archie khác để bạn thử. Sau cùng rồi bạn cũng vào được.
Bảng 19-1: Các server Archie
Tên server Vị trí
archie.rutgers.edu New Jersey
archie.sura.edu Maryland
archie.unl.edu Nebraska
1
Website: http://www.docs.vn Email : lienhe@docs.vn Tel (: 0918.775.368
archie.ans.net New York
ds.internic.net Mỹ (chạy bởi At&T)
archie.mcgill.ca Canada
archie au úc
archie.th-darmstadt.de Châu Âu (Đức)
archie.funet.fi Châu Âu (Phần Lan)
archie.luth Châu Âu (Thụy Điển)
archie.univie.ac.at Châu Âu (áo)
archie.doc.ic.ac.uk Anh và châu Âu
archie.cs.hugi.ac.il Israel
archie.ad.jp Nhật
archie.kuis.kyoto-u.ac.jp Nhật
archie.sogang.ac.kr Hàn quốc
archie.nz Tân tây lan
archie.ncu.edu.tw Đài loan
Bạn có thể truy cập những server Archie theo nhiều cách:
 Nếu bạn có một phần mềm khách hàng Archie (tên là archie hay
xarchie), bạn có thể chạy trực tiếp từ máy của mình (xem phần "Archie thẳng" và
"Xarchie" sắp tới trong chương này).
 Bạn có thể telnet đến một server Archie (xem phần telnet Archie sau
đây)
 Bạn có thể email yêu cầu của mình đến một server Archie (xem phần
"Email Archie")
Telnet Archie
Trừ phi chỗ bạn có phần mềm khách hàng Archie (thử dùng lệnh archie,
hoặc xarchie trên một máy windows hoặc tương tự như Motif), bạn có thể muốn
telnet đến một server Archie. Tuy nhiên, trước khi làm như vậy, nếu có thể, khởi
động một file log (một file trong đó tất cả các văn bản hiện lên trên cửa sổ của bạn
2
Website: http://www.docs.vn Email : lienhe@docs.vn Tel (: 0918.775.368
đều bị tóm lấy) bởi vì kết xuất của Archie có thể quá nhanh và rối rắm, với các tên
file, tên máy chủ, và các địa chỉ Internet đến nỗi bạn không muốn chép chúng bằng
tay nếu có thể tránh được. Nếu bạn đang chạy một máy với XWindows hoặc một
biến thể của nó như Motif, hãy giữ phím Ctrl, bấm nút bên trái con chuột, chọn Log
to File từ cửa sổ Main Options. Nếu không phải đang chạy X, hãy hỏi xung quanh
xem có sẵn chương trình nào đó không để tóm văn bản trên màn hình vào một file.
Bây giờ, chọn một server rồi telnet với tên là archie như sau:
% telnet archie.ans.net
Trying
Connected to forum.ans.net.
Escape character is '^}'. Archie
AIX telnet (forum.ans.net) IBM AIX Version 3 for RISC System/6000
(C) Copyrights by IBM and by others 1982, 1991.
login: archie
Archie sẽ trả lại một dấu nhắc
Archie>
Bảo cho Archie cách cư xử: lệnh set và lệnh show
Mỗi một server Archie được thiết lập với các đặc tính mà bạn có thể chỉnh
đổi để phù hợp với nhu cầu của mình. Bạn có thể cần phải đổi chúng để cho Archie
làm điều bạn muốn. Không phải server Archie nào cũng như nhau, và bạn phải chú
ý những gì được thiết lập trên server mà bạn vào.
Để xem server bạn đang dùng được thiết lập như thế nào, dùng lệnh show :
archie> show
# ' autologout ' (type numeric) has the value '15'.
# 'mailto (type string) is not set.
# 'maxhits' (type numeric) has the value '100'.
# ' pager ' (type boolean) is not set.
3
Website: http://www.docs.vn Email : lienhe@docs.vn Tel (: 0918.775.368
# ' search ' (type string) has the value 'sub'.
# ' sorthy ' (type string) has the value 'none'.
# ' status ' (type boolean) is set.
# ' term ' (type string) has the value 'dumb 24 80'
Bạn cũng có thể dùng lệnh show để xem những giá trị đặc thù từng giá trị
một (thử đánh vào show term, show search, v.v ) Những giá trị này sẽ được giải
thích sau, các biến mà bạn cần chú ý cẩn thận là search và maxhits. tôi khuyên là
nên đặt giá trị cho pager để nói cho Archie ngưng lại sau mỗi màn hình và đợi bạn
bấm thanh khoảng trắng, nhờ đó mà điều khiển màn hình kết xuất của Archie.
Tìm kiếm là một nỗi buồn ngọt ngào, hoặc cái gì đó
Thông thường, archie tìm tên chứa xâu ký tự bạn gõ vào, không cần biết là
viết thường hay viết hoa. Thành ra nếu bạn tìm chữ pine, nó tìm ra chữ PINE,
pineapple, và spineless. Nếu bạn dùng archie nhiều, bạn sẽ muốn điều khiển quá
trình tìm kiếm nhiều hơn, nên bạn sẽ muốn một phương pháp tìm kiếm khác để tìm
đúng những gì bạn muốn. Bạn càng biết nhiều về tên muốn tìm, càng dễ xác định
phương pháp tìm kiếm.
Để định ra phương pháp tìm kiếm, dùng lệnh set:
archie> set search sub
Các phương pháp tìm kiếm có trong Archie là sub, subcase, exact và regex.
Các phần kế tiếp sẽ bàn về cách hoạt động của chúng.
Phương pháp sub
Phương pháp này tìm ra các xâu ký tự con có trong tên file, không phân biệt
chữ thường chữ hoa. Nếu bạn có biết gì về xâu ký tự có trong tên file, dùng sub.
Phương pháp subcase
Phương pháp này tìm chính xác xâu ký tự có trong tên file, có phân biệt chữ
thường chữ hoa. Chỉ dùng nó nếu bạn chắc chắn về tình trạng viết thường hay hoa
của các ký tự trong tên file.
4
Website: http://www.docs.vn Email : lienhe@docs.vn Tel (: 0918.775.368
Phương pháp exact
Phương pháp này tìm chính xác tên file như bạn gõ vào. Đây là cách tìm
nhanh nhất, và bạn nên dùng nó nếu bạn biết chính xác bạn đang tìm cái gì.
Phương pháp regex
Dùng biểu thức thông thường trong Unix để định kiểu tìm cho Archie. Đây
là một loại xâu tìm kiếm con đặc biệt và Archie sẽ cố đưa biểu thức đó khớp với
một xâu ký tự có trong tên file. Trong các diễn đạt thông thường, một số ký tự có ý
nghĩa đặc biệt, và các diễn đạt này có thể trông hơi phức tạp, nếu bạn dùng những
ký tự đó.
 Nếu bạn biết xâu ký tự đầu của tên file, bắt đầu bằng dấu ^ (dấu caret)
để cột xâu ký tự đó vào đầu tên file.
 Nếu bạn biết file kết thúc với một xâu ký tự đặc biệt nào đó, đặt dấu $
(dấu dollar) sau cùng để cột xâu ký tự vào cuối tên file.
 Dấu . (dấu chấm) dùng để chỉ một ký tự đơn bất kỳ.
 Dấu * (dấu sao) có nghĩa là có một số bất kỳ (kể cả 0) các ký tự thông
thường (đi trước nó).
 Dùng dấu [ và ] (ngoặc vuông) để liệt kê một bộ các ký tự phải tìm,
hoặc một dải các ký tự cần tìm. Kết hợp với dấu ^ (caret) ở đầu, dấu ngoặc vuông
liệt kê một loạt các ký tự đưa vào hay loại ra trong khi tìm.
 Bạn có thể chỉ ra nhiều hơn một dải ký tự trong cùng một tìm kiếm.
Nếu bạn cần một ký tự đặc biệt như một phần của xâu tìm kiếm, hãy đặt một dấu \
(dấu chéo ngược) trước nó.
Ví dụ, để tìm bất kỳ file nào có chứa xâu birdie, và tận cùng là txt, gõ vào:
prog *birdie.*txt$
Để tìm các tên file có chứa các ký số, gõ vào
prog [0-9]
Để loại trừ các tên file có chứa các ký tự viết thường, gõ vào
prog [^a-z]
Bạn muốn nhìn trong bao lâu
5
Website: http://www.docs.vn Email : lienhe@docs.vn Tel (: 0918.775.368
Biến maxhits xác định số lần Archie cố tìm ra. Trên nhiều server, mặc nhiên
của giá trị này là 1000 - nhưng đối với phần lớn các tìm kiếm thì như vậy quá
nhiều. Nếu bạn biết tên của file mà bạn muốn, bạn muốn chọn từ đó bao nhiêu file?
10 hay 20 là đã đủ để chọn lựa rồi. Nhưng nếu bạn không định lại cho maxhits,
Archie sẽ tiếp tục du hành trên Net để tìm cho ra 1000 tên như vậy.
Cũng nên nhớ rằng kết xuất của Archie có thể đưa ra màn hình hoặc file
login của bạn - nên phải để ý đến khối lượng dữ liệu mà bạn cần phải xử lý. Sau khi
bạn quyết định là muốn biết nhiều hay ít, định giá trị đó cho maxhits (giả sử là 100)
archie> set maxhits
Bảng 19-2 liệt kê các thiết lập khác cho lệnh set
Bảng 19-2 Những đặc điểm linh tinh khác dùng trong lệnh set
Biến Tác dụng làm gì
autologout Định ra thời gian Archie đợi bạn làm cái gì đó trước khi nó đá
bạn ra
mailto thiết lập địa chỉ email dùng trong lệnh mail
pager khi được thiết lập, sẽ gởi những kết xuất của Archie qua một chương
trình phân trang là less, có tác dụng dừng màn hình mỗi trang chờ bạn nhấn phím
khoảng trắng. Dùng lệnh set pager để bật tắt chế độ phân trang on/off, dùng lệnh
show trước đó để tránh làm ngược lại những gì bạn muốn làm.
sortbySắp xếp những kết xuất của Archie theo một trong các thứ tự:
hostname theo thứ tự chữ cái (alphabet) tên máy chủ hay ngược lại (rhostname);
thời gian điều chỉnh gần đây nhất (time) hay cũ nhất (rtime); kích thước (size) lớn
trước nhỏ sau hay ngược lại (rsize); tên file (filename) theo thứ tự chữ cái hay
ngược lại (rfilename); hoặc không sắp xếp (unsorted) như dạng mặc nhiên. Bạn gõ
vào chẳng hạn như là set sortby time.
status Nếu có, Archie chỉ ra diễn tiến của việc tìm kiếm. Có thể dùng khi
6
Website: http://www.docs.vn Email : lienhe@docs.vn Tel (: 0918.775.368
Archie rất chậm
term Định ra loại trạm cuối mà bạn đang dùng để Archie có thể thu vén kết
xuất của nó cho phù hợp (thử dùng vt100 nếu bạn không chắc)
Tìm đi !
Lệnh cơ bản của Archie là prog, có dạng như sau:
prog searchstring
Và chỉ vậy thôi. Lệnh đó bắt đầu cả một công việc tìm kiếm. Bản chất và
phạm vi tìm kiếm được xác định bởi các biến mà bạn định ra hoặc không định ra.
Sau đây là một ví dụ. Giả sử là tôi muốn tìm loại phần mềm font nào hiện có:
archie> prog font
Host csuvax1.murdoch.edu.au (134.115.4.1)
Last updated 00:23 31 Jul 1993
Location: /pub/mups
FILE rw-r-r 4107 Nov 16 1992 font.f
FILE rw-r-r 9464 Nov 16 1992 fontmups.lib
Host sifon.cc.mcgill.ca (132.206.27.10)
Last updated 04:22 11 Aug 1993
Location: /pub/pakages/gnu
FILE rw-r-r 628949 Mar 9 19:16 fontutils-0.6.tar.z
Host ftp.germany.eu.net (192.76.144.75)
Last updated 05:24 7 May 1993
Location: /pub/pakages/gnu
FILE rw-r-r 633005 Oct 28 1992 fontutils-0.6.tar.z
Location: /pub/gnu
FILE rw-r-r 1527018 Nov 13 16:11 ghostscript-fonts-2.5.1.tar.z
Host ftp.uu.net (192.48.96.9)
Last updated 08:17 31 Jul 1993
7
Website: http://www.docs.vn Email : lienhe@docs.vn Tel (: 0918.775.368
Location: /systems/att7300/csvax
FILE rw-r-r 1763981 Mar 5 23:30 groff-fonts.tar.z
Host reseq.regent.e-technik.tu-muenchen.de (129.187.230.225)
Last updated 06:26 10 Aug 1993
Location: /inofrmatik.public/comp/typesetting/tex/tex3.14/DVIware/
laser-sett ers/umd-dvi/dev
FILE rw-r-r 51 Sep 24 1991 fontdesc
Host nic.switch.ch (130.59.1.40)
Last updated 04:48 7 Aug 1993
Location: /software/unix/TeX/dviware/umddvi/misc
FILE rw-r-r 607 Oct 2 1990 fontdesc
Và bạn nhanh chóng nhận ra nhiều trùng lặp trong các liệt kê trên. Nếu bạn
muốn tìm những gì không trùng lặp, bạn có thể đưa một loạt câu hỏi để tránh
những gì đã tìm ra rồi, và làm cho những câu hỏi sau có kết quả hơn.
Khi bạn đã tìm ra nó, hoặc một vài trong số đó nó là cái gì?
Chắc chắn là có nhiều thứ vớ vẩn ở đó. Nhưng nó là cái gì? Đôi khi Archie
có thể giúp bạn hình dung ra nó là gì. Tôi nói đôi khi bởi vì thông tin mà Archie
đưa ra phụ thuộc vào những gì có ở những nơi nó tìm ra. Đối với những phần mềm
trọn gói có một mô tả đi kèm, lệnh whatis có thể cho bạn một số thông tin hữu ích.
Lệnh whatis thực ra cũng là một loại lệnh tìm kiếm khác - nó tìm kiếm các cơ sở
dữ liệu mô tả phần mềm ở các archive riêng rẻ để tìm ra xâu ký tự mà bạn cung
cấp, thay vì tìm các tên file trong thư mục. Nếu bạn muốn tìm một phần mềm đặc
thù nào đó, bất chấp nó được gọi là gì, bạn có thể dùng lệnh whatis để bắt đầu việc
tìm kiếm.
Ví dụ, nếu dùng whatis thay cho prog trong việc tìm kiếm phần mềm font,
tôi nhận được những thứ sau đây:
archie> whatis font
8
Website: http://www.docs.vn Email : lienhe@docs.vn Tel (: 0918.775.368
afm2tfm Translate from Adobe to TeX page support)
gftodvi Converts from meta fonts to DVI format
gftopk Converts from meta fonts to PK format
gftopxl Converts from meta fonts to PXL format
her2vfont Hershey fonts to 'vfont' rasterizer
hershey Hershey Fonts
hershey.f77 Hershey fonts in Fortran 77
hershtools Hershey font manipulation tools and data
hp2kp HP font conversion tool
jetroff/bfont Jetroff Basic Fonts
jis.pk The JTeX.300pk fonts (Japanese language support)
k2ps Print text files with Kanji (uses JTeX fonts)
(Japanese language support)
mkfont Convert ASCII font descriptions <-> device-
independent troff (ditroff) format
ocra-metafont METAFONT sources for the OCR-A "Alphanumeric
Character Sets for Optical Recognition"
Lưu ý: xâu ký tự font xuất hiện trong một số trong những tên file này, nhưng
chỉ trong phần mô tả đối với những file khác.
Từ đây bạn có thể đến đó
Archie tìm ra những thứ vớ vẩn rất tuyệt nhưng chẳng giúp gì được để thật
sự lấy những thứ đó cho bạn. (Thật ra xarchie giúp được tốt, nên nếu bạn có nó, có
thể bạn nên dùng nó). Để thật sự lấy những thứ vớ vẩn trên Net, bạn phải làm
những gì Archie đã làm trong chỗ đầu tiên: dùng FTP (File Transfer Protocol) để
chép nó từ archive của nó về máy của bạn. Vì hầu như là bạn không muốn làm lần
lượt qua các archive mà Archie tìm ra, có thể dùng FTP vô danh (login vào với tên
người sử dụng chung là anonymous). Một khi bạn đã login để FTP, dùng lệnh cd để
chuyển đến thư mục thích hợp, dùng lệnh get hay mget để lấy file. Xem chi tiết ở
chương 16.
9
Website: http://www.docs.vn Email : lienhe@docs.vn Tel (: 0918.775.368
Nếu bạn hỏi đến những phần mềm có liên quan, sau khi FTP vào một máy
chủ có những thứ thích hợp, bạn có thể tìm xem trong thư mục chứa file mà bạn
muốn (dùng lệnh dir của ftp để liệt kê nội dung thư mục ở xa) và trong bất kỳ thư
mục con nào gần nó.
Archie thẳng
Nếu bạn thử đánh lệnh archie một cách trực tiếp, và nó trả lại một chú thích
về cách dùng nó, thế là may cho bạn. Bạn có thể trực tiếp dùng phần mềm khách
hàng Archie mà không cần phải telnet đến server Archie. Một lợi thế lớn khi dùng
Archie từ dòng lệnh là bạn có thể dễ dàng tái định hướng kết xuất của nó ra một
file, như trong câu lệnh sau:
$ archie -ld font > fontfiles
Lệnh này cất kết quả tìm kiếm trong một file gọi là fontfiles, mà bạn có thể
tùy nghi nghiên cứu sau này bằng một trình soạn thảo văn bản hay một trình xem
file (file viewer). Tuy nhiên lưu ý là phần mềm khách hàng cũng có giới hạn thôi
và bạn nên telnet đến server Archie để dùng các khả năng có ưu thế hơn của
Archie. Ví dụ, bạn không thể thiết lập các biến tinh chỉnh đã mô tả trong phần
telnet Archie trong phần trước của chương này. Cũng vậy, bạn không thể dùng lệnh
whatis.
Dùng Archie trực tiếp có nghĩa là bạn dùng một dòng lệnh có thể bị phức
tạp. Bạn có thể chỉ ra loại tìm kiếm, server Archie mà bạn muốn dùng, và dạng kết
xuất với một mức độ giới hạn. Nếu bạn cung cấp một xâu tìm kiếm và không có
biến chỉnh sửa nào, mặc định của Archie là tìm ra chính xác đến tối đa 95 lần. Về
chi tiết chọn một phương pháp tìm kiếm, và những chọn lựa khác, xem lại phần
telnet Archie trong chương này.
Bảng 19-3 liệt kê các biến chỉnh sửa mà bạn có thể dùng.
Bảng 19-3 Các biến chỉnh sửa tìm kiếm
Biến chỉnh sửa Archie Biến tương đương trên Telnet ý nghĩa đối với
Archie
10
Website: http://www.docs.vn Email : lienhe@docs.vn Tel (: 0918.775.368
-c subcase Định chế độ tìm kiếm cho một xâu ký tự con có phân biệt
chữ hoa
-e exact Định chế độ tìm kiếm đúng chính xác một xâu ký tự (mặc
nhiên)
-r regex Định chế độ tìm kiếm cho một tác vụ tìm kiếm với biểu thức
thông thường
-s sub Định chế độ tìm kiếm một xâu ký tự con
-l Liệt kê mỗi lần tìm ra trên một dòng
-t sortbySắp xếp kết xuất của Archie theo ngày, ngày sau cùng trước hết.
-m# maxhits Định số lần tìm ra tối đa (mặc nhiên là 95)
-h Chỉ ra server Archie sử dụng
-L Liệt kê các server Archie đã biết và cái mặc nhiên hiện tại
Ví dụ, để dùng server archie.ans.net tìm kiếm theo một biểu thức thông
thường không quá 50 file chứa các ký số trong tên:
$ archie -r -m50 -h archie.ans.net "[0-9]"
(Chú ý rằng dạng [0-9] được bao trong cặp dấu nháy kép để tránh hiểu nhầm
như tên file tìm ra một cách cục bộ. Nói chung nên đưa kiểu tìm kiếm trong ngoặc
kép nếu chúng có những ký tự khác với chữ và số thông thường).
Xarchie
Nếu bạn có đủ may mắn để chạy XWindows hoặc một bà con gần gũi của
nó, và có sẵn xarchie ở đó, hãy dùng nó. Nó cho phép bạn định ra phần lớn các
thiết lập Archie từ menu chính và menu settings. Hơn nữa, sau khi hoàn tất tìm
kiếm, xarchie cho phép bạn duyệt qua các máy chủ và tên file và nháy để chọn cái
nào mà bạn quan tâm (xem hình 19-1).
Sau khi tìm được những gì bạn muốn, bạn có thể chọn FTP từ menu chính,
và xarchie chuyển chính nó thành một phiên bản giản lược của chương trình FTP
và lấy file ở xa cho bạn và đặt file đó vào thư mục hiện thời hoặc trong thư mục mà
11
Website: http://www.docs.vn Email : lienhe@docs.vn Tel (: 0918.775.368
bạn chỉ ra trong menu setting (xem hình 19-2).
Hình 19-1: Dùng xarchie để tìm file
Hình 19-2: menu chọn lựa của xarchie.
Archie email
Nếu bạn không thể telnet đến một server Archie hoặc là vì giới hạn của
đường nối mạng của bạn hoặc vì bạn không thành công khi login vào một server
Archie, bạn có thể dùng email để gởi yêu cầu của mình đến Archie. Nếu bạn định
tìm nhiều và không muốn đợi trả lời, cách dùng Archie bằng email là tốt cho bạn.
Dùng email bạn không có tất cả các khả năng như khi telnet đến Archie,
nhưng bạn cũng vẫn có thể thực hiện một tìm kiếm thông thường. Để gởi một yêu
cầu đến Archie, bạn gởi thư đến : archie@servername, với servername là bất kỳ
một server Archie nào đề cập đến ở đầu chương này.
Phần thân của thông điệp email mà bạn gởi chứa những lệnh mà bạn muốn
đưa đến Archie. Nhập vào bao nhiêu lệnh tùy thích, mỗi lệnh bắt đầu từ cột đầu
tiên của dòng. Chọn trong số những lệnh có sẵn sau đây:
Lệnh Làm cái gì
prog Tìm ra đúng các tên; giả định là một biểu thức tìm kiếm thông thường
(regex).
whatis Cung cấp từ khoá để tìm kiếm trên cơ sở dữ liệu mô tả phần
mềm.
compress Gởi câu trả lời ở dạng nén và mã hoá.
servers Trả lại một danh sách các server Archie.
path Cho địa chỉ email mà bạn muốn Archie sử dụng để trả lời yêu cầu
email của bạn, nếu địa chỉ trả lời tự động phát sinh qua email của bạn là không
đúng
12

Không có nhận xét nào:

Đăng nhận xét