Data modyfikacji: 21 czerwca 2002

7. Jak przeszukiwać zasoby Internetu?

W rozdziale dotyczącym Aplikacji w podrozdziale 4.1.3. Wyszukiwarki internetowe przedstawiono krótką informację nt. ich obsługi. Dalszym problemem jest zatem, czego możemy poszukiwać poprzez szperacze internetowe lub poprzez inne aplikacje (archie, ftp, gopher itp.).

Szukamy rekordów (w bazie danych) i tworzymy własne, szukamy konkretnych informacji na interesujący nas temat, szukamy potwierdzenia miejsca, gdzie znajduje się żądana informacja, czy też chcemy określony zbiór danych, wykorzystać do własnych celów. Ale to nie koniec. Możemy dokonać zakupów nie wychodząc z domu, posługując się kartą kredytową. Jak zrobić te wszystkie operacje? Należy zaopatrzyć się we właściwe narzędzia internetowe i oczywiście adresy.

Ważną usługą dostępną w Internecie jest możliwość przeglądania różnych archiwów i katalogów bibliotecznych. Rozmiary takiej bibliotecznej bazy są olbrzymie. Zapisanie tego wszystkiego na własny dysk byłoby niemożliwe, ze względu na jego rozmiar. Możemy zatem pracując na własnym komputerze przeglądać wszystkie dane a zapisywać na własnym dysku, tylko to co uważamy za potrzebne. Najważniejszą rzeczą dostępu do tych obszarów wiedzy są ich adresy, które możemy uzyskać w przeróżny sposób:

  1. w Internetowych książkach adresowych,
  2. poprzez artykuły w czasopismach, informacje w radiu, telewizji,
  3. poprzez znajomych,
  4. poprzez serwisy wyszukiwawcze ogólne i tematyczne, typu : AltaVista, Dejanews, Bibliofind itd.,
  5. katalogi polskie i zagraniczne, obecnie zwane portalami np. Yahoo, Snap, Polonia Net, WOW!, Wirtualna Polska, Onet.pl
  6. multiwyszukiwarki internetowe i lokalne np. BigHub, Szukaj.Com lub Internetowy Poszukiwacz
  7. serwery wspomagające wyszukiwanie, jak : Alexa.

Ważną też rzeczą jest umiejętność wyszukiwania informacji poprzez różnego rodzaju szperacze. Omówię teraz sposoby wyszukiwania przez AltaVistę. Podobne zasady obowiązują inne wyszukiwarki. Jeśli chcemy je dokładnie poznać, na każdej z głównych stron wyszukiwarek znajduje się często "helpy" i właśnie tam znajdziemy interesujące nas informacje.

W celu zawężenia kryteriów wyszukiwania obowiązują pewne zasady. Odnoszą się one do właściwego oznaczania ciągu znaków. I tak:

  1. wprowadzenie dwóch słów, np.: informacja elektroniczna, powoduje odnalezienie dokumentów, które zawierają jedno z podanych słów albo informacja albo też elektroniczna
  2. Jeżeli wprowadzimy zapis z cudzysłowem "informacja elektroniczna" wówczas poszukiwane będą dokumenty, które zawierają oba podane wyrazy
  3. Podobny efekt osiągniemy jak w drugim przypadku, gdy zamiast cudzysłowia wstawimy pomiędzy średnik informacja ; elektroniczna
  4. Jeżeli informację zapiszemy małymi literami to wyszukiwarka wyszuka nam dokumenty zarówno pisane małymi, jak i dużymi literami, jeśli napiszemy je dużymi literami wyszukiwarka odszuka nam tylko te dokumenty, które są napisane dużymi literami (będą to słowa dokładnie tak jak podano, np. informaCja Elektroniczna)
  5. Każde słowo lub ciąg ujęty w cudzysłów może być poprzedzone znakiem plus (+) lub minus (-). Symbole te pozwalają użytkownikowi na budowanie złożonych kryteriów wyszukiwania:
  6. +informacja +elektroniczna -"CD-ROM" oznacza, że będą wyszukane wszystkie dokumenty dotyczące informacji elektronicznej poza CD-ROM.

  7. Obok podawania pełnych wyrazów możliwe jest ich obcinanie i zastępowanie znakiem gwiazdka (*). Znak ten symbolizuje dowolny ciąg wyrazów. Używa się go przeważnie wówczas, gdy wyraz którego szukamy ma różne końcówki np. Elektroni*. Będą wyszukane wszystkie wyrazy, które zaczynają się na elektroni a mają różne zakończenia np. elektronika, elektroniczny, elektronice, elektronikom, elektronik, elektroniczna itp.
  8. Możliwe jest także ograniczanie do określonych elementów dokumentów wyszukiwanych.

title: "informacja elektroniczna" - oznacza, że zostaną wyszukane tylko strony, które w tytule mają wyraz informacja elektroniczna,

text : "informacja elektroniczna" - oznacza, że zostaną wyszukane dokumenty, które w swojej treści mają informacja elektroniczna,

link: "informacja elektroniczna" - oznacza, że zostaną wyszukane te strony, które zawierają przynajmniej jeden odnośnik do strony o adresie informacja elektroniczna

image : pies.jpg - oznacza, że odnalezione zostaną strony, na których znajduje się rysunek o podanej nazwie

domain:pl - oznacza, że wyszukane zostaną strony, które w domenie mają rozszerzenie .pl, tj. Polskę.

W wyszukiwarkach typu NETOSKOP [08.03.2002], który został założony jako pierwszy całkowicie polski serwis wyszukiwawczy, katalogujący strony WWW, zasady wyszukiwania są nieco odmienne, choć filozofia jego konstrukcji podobna. I tak:

  • "NEToskop pozwala na wyszukiwanie informacji w dwóch trybach: prostym i logicznym. Dokładny opis obydwu trybów znajduje się poniżej.
  • W polu edycyjnym NEToskopa należy wpisać słowa (oddzielone spacjami), które najlepiej charakteryzują poszukiwane informacje. W odpowiedzi NEToskop poda listę stron zawierających wszystkie wymienione słowa. Prawidłowo zadane pytanie może np. wyglądać następująco:
  • samochód osobowy Fiat

  • NEToskop dopuszcza również możliwość wyszukiwania informacji używając operatorów logicznych: OR, AND, NEAR, NEXTTO i ANDNOT
  • słowo1 AND słowo2 NEToskop zwróci strony zawierające obydwa słowa. W przypadku pytań nie zawieraj innych operatorów poza AND zaleca się użycia trybu prostego.
    słowo1 OR słowo2
    Zostaną zwrócone odsyłacze do stron zawierających słowo1 lub słowo2.
    słowo1 NEAR słowo2 NEToskop wyszuka strony, na których znajdują się obydwa słowa, pod warunkiem, że oddzielone są one co najwyżej trzema innymi słowami.
    słowo1 NEXTTO słowo2  Zwrócone zostaną linki do stron, gdzie słowo1 i słowo2 występują obok siebie.
    słowo1 ANDNOT słowo2 NEToskop zwróci strony, na których znajdują się slowo1 ale nie słowo2

    Pytania w trybie logicznym mogą być zadawane przy użyciu kilku operatorów logicznych. Dopuszcalne jest również uzywanie nawiasów. Poprawnie sformułowane pytanie może być zbudowane następująco:
    samochód  NEXTTO osobowy AND Fiat NEAR 126 AND (Tipo OR Seicento)

  • NEToskop może ograniczyć poszukiwania do konkretnych domen, serwerów, a nawet katalogów.
    • Aby wyszukać strony zawierające słowo "komputer" znajdujące się na serwerach w domenie chip.pl należy w okienku dialogowym wpisać:

komputer @chip.pl

    • Aby NEToskop zwrócił strony, zawierające słowo "komputer", znajdujące się jedynie na serwerze www.chip.pl, wystarczy wpisać:

komputer @www.chip.pl

    • Jeśli chcemy przeszukać katalog /hardware/ na serwerze www.chip.pl, piszemy:

komputer @www.chip.pl/hardware/

  • Wyszukane strony są sortowane według oszacowanej wartości względem zadanego pytania.
  • Kryteria oceny stosowane przez serwis pokazują kulki z cyframi i one są następujące:

        słowa znajdują się na stronie obok siebie, w tej kolejności, w której zostały wpisane w pytaniu, a poza tym są wymienione w polu title tej strony;

        słowa znajdują się na stronie obok siebie, w tej kolejności, w której zostały wpisane w pytaniu, a poza tym są wymienione w polu h1 danej strony;

        słowa znajdują się na stronie obok siebie, w tej kolejności, w której zostały wpisane w pytaniu, a poza tym są wymienione w polu h2 lub są wyróżnione (np. pogrubione, powiększone, napisane inną czcionką);

        słowa znajdują się na stronie obok siebie, w tej kolejności, w której zostały wpisane w pytaniu, nie są jednak w żaden dodatkowy sposób wyróżnione;

        słowa znajdują się na stronie, lecz nie obok siebie lub nie w tej kolejności, w której zostały wpisane w pytaniu

        Niebieska kulka bez cyfry pojawia się wtedy, gdy strony zostały wyszukane w trybie logicznym. 

  • W trybie dokładnym NEToskop wyszukuje strony zawierające dokładnie te słowa, które są w zapytaniu. W trybie przybliżonym zwracane są również strony zawierające słowa podobne do znajdujących się w zapytaniu (np. o innej końcówce).
  • Parametr ten wybiera zakres wyświetlanych przez NEToskopa odpowiedzi. Zaznaczenie opcji odpowiedzi skrócone sprawia, że wyniki zawierają jedynie tytuły znalezionych stron i ich adres. Opcja odpowiedzi pełne włącza dodatkowe wyświetlanie streszczenia strony".

Nieco inny sposób wyszukiwania jest umieszczony na Wirtualnej Polsce. Administracja WP dostarcza kod do tej wyszukiwarki i można go zainstalować na własnej stronie, co też uczyniłam. Po prawej stronie można sprawdzić, jak należy przeszukiwać zasoby WWW: 

zaawansowane
InfoBazy
jak szukać
Katalog Polskie WWW Światowe WWW
Wirtualna Polska Katalog Światowy Pliki Newsy

Metody wyszukiwawcze12 na serwerze HOTBOT URL http://www.hotbot.com/ przedstawia ANEKS XIII.lub  Wiadomości Internetowe http://www.winter.pl/hotbot.html [08.03.2002]. Ćwiczenia 1-5,   ćwiczenia 8, 11, 13-19 przybliżą znajomość tematyki i pozwolą na dokładne zapoznanie się z metodami wyszukiwawczymi poszczególnych szperaczy. Powyższe ćwiczenia można wykonywać nie tylko poprzez przeglądarkę IE ale również Netscape Navigator czy Operę lub inne. Można także używać różnych przeszukiwaczy, aby dokonać większego wyboru przeszukań. Ciekawą stronę dotyczącą umiejętności wyszukiwania stworzył młody 19-letni chłopak interesujący się wieloma dziedzinami wiedzy. A oto adres: http://teknoidalna.silesianet.pl/wyszukiw_jak.htm 
Oto niektóre jeszcze adresy ciekawszych portali i vortali, tj. serwisów uporządkowanych tematycznie z wielu lub jednej dziedziny:

Bibliofind http://www.bibliofind.com/
[10.03.2002]
wyszukiwarka starodruków, białych kruków i czasopism
Interia http://www.interia.pl/ [10.03.2002] zawiera serwisy tematyczne, zmieniające się bardzo często w ciągu dnia, WAP
Amen. Zasoby internetowe ks. W. Mroza http://www.amen.pl/ [10.03.2002] portal katolicki
Polski Serwer Prawa http://www.prawo.lex.pl/ [10.03.2002] portal zawiera serwis prawa: DzU, MP, adresy stron prawników itp.
Zdrowie http://www.zdrowie.com.pl/ [10.03.2002] portal stron o zdrowiu
Polski portal Internetowy http://www.portal.net.pl/ [10.03.2002] portal zawierający serwisy tematyczne
Literatura.net.pl http://www.literatura.net.pl/start.html [10.02.2002] informacje na temat literatury, książki elektroniczne, sklep
Serwis Wędkarski http://www.fishing.pl/index.shtml [10.03.2002] serwis dotyczący wędkarstwa
Portal dotyczący Internetu http://root.pl/ [10.03.2002] informacje, technologie, dokumentacje
Podkarpacki Portal Internetowy C2000 http://www.c2000.pl/ [10.03.2002] informacje dotyczące Podkarpacia
Polski ogród Internetowy http://ogrody.agrosan.pl/witaj.html [10.03.2002] vortal dotyczący grupy dyskusyjnej pl.rec.ogrody
Studencki vortal Internetowy http://www.studiowanie.prv.pl/ [10.03.2002] vortal dla studiujących w Tomaszowie Mazowieckim
Wort@l MP3 http://www.axportal.republika.pl/
k_muzyka.htm
[10.02.2002]
portal muzyczny
KINOMAN http://zonevision.home.pl/na/na071620.php [10.03.2002] portal filmowy

Rysunek 121 Portal Interia 

rys 121

Zajrzyj do rozdziału Portale, Łukasz Janicki omówił je dosyć dokładnie. 

Pomocą przy wyszukiwaniu różnego rodzaju informacji służą aplikacje internetowe powstające coraz częściej, a związane z łączeniem się z serwerami WWW, Archie, Gopher lub FTP i ściąganiem potrzebnych plików np. w tym samym czasie.

Rysunek 122 Program Jack Hammer 2.2  do łączenia się jednocześnie z kilkoma serwerami

rys 122

Rysunek 123 Ściąganie z serwera Tucows programu Jack Hammer 2.2

rys 123

Rysunek 124 Aplikacja NearSite for Windows

rys 124

 

Do ściągnięcia na dysk twardy swojego komputera i przeglądania danych z określonych serwisów WWW off-line służy m. in. program NearSite [10.03.2002] for Windows.

Wyszukiwaniem informacji z różnych szperaczy internetowych służy m. in. Copernic [10.03.2002] zlecając im odnalezienie wpisanych haseł. Jest to zaawansowane narzędzie służące do wyszukiwania informacji w Internecie, korzystające z mechanizmów powszechnie znanych szperaczy - inaczej mówiąc, Copernic jest swoistą nakładką na nie, ale oferując szereg dodatkowych funkcji, program należy do bardziej rozwiniętych funkcjonalnie instrumentów tego rodzaju. Niestety darmowa wersja tego oprogramowania nie ujmuje polskich szperaczy.

Rysunek 125 Copernic99 v. 3.02

rys 125

 

Rysunek 126 Wybrane przez Copernica miejsca w których znajdują się wyszukane zbiory

rys 126

Innym ciekawym i bardzo wydajnym programem wspomagającym pracę z plikami i ich ściągnięciem jest program NetVampire [10.03.2002]. Aplikacja ta, bez względu na zerwanie połączeń wznawia pracę od miejsca w którym skończyła, samodzielnie logując się na serwerach ftp i www pracując aż do skutku, tj. do 100% zapisania ściąganego pliku na dysku C. Wykonanie ćwiczenia 12 pozwoli uzyskać program NetVampire z sieci Internet a następnie dla zapoznania się z działaniem programu przygotowane jest ćwiczenie 20.

Rysunek 127 Net Vampire ściągający plik z ftp

rys 127

Kolejnym programem, dzięki któremu pobieranie plików z Internetu jest łatwe i proste to program Go!Zilla [10.03.2002]. Gdy z poziomu przeglądarki WWW bierzemy jakiś plik do pobrania, Go!Zilla natychmiast przejmuje kontrolę nad tą operacją i będzie troszczyć się o jej prawidłowy przebieg. 

Bardzo przydatną aplikacją do pracy z wyszukiwaniem plików, dokumentów, ilustracji, dźwięków jest Internetowy Poszukiwacz [10.03.2002] pozwalający na zapis listy wybranych i wyszukanych dokumentów oraz na ich przeglądanie w przeglądarce. W ANEKSIE VII wykorzystano rezultat przeglądania kilkunastu wyszukiwarek poprzez oprogramowanie Internetowego Poszukiwacza.

Rysunek 128 Efekt wyszukania hasła "Polska sztuka ludowa" 

rys 128

Internetowy Poszukiwacz wysyła zapytania do kilkunastu systemów wyszukiwawczych - zachodnich AltaVista, HotBot, Excite, InfoSeek, WebCrawler, Yahoo i Lycos, polskich InfoSeek PL, WOW, Wirtualna Polska, AltaVista PL, NEToskop i OptimusNET, a także do serwisów FTPSearch i MP3flash. Należy jedynie podać wyszukiwaną frazę w polu Znajdź i wybrać opcję Którykolwiek lub Wszystkie. Pierwsza spowoduje wyszukiwanie któregokolwiek podanego we frazie wyrazu, natomiast druga - wszystkich jednocześnie.

W okienku opcji zaznaczamy te wyszukiwarki, z których chcemy skorzystać w danej sesji. Migające "diody" sygnalizują aktywność poszczególnych wyszukiwarek w trakcie pracy. Trzeba niestety, liczyć się z długim szukaniem, co nie powinno dziwić, gdy angażujemy tak potężne serwisy. Można jednak w dowolnym momencie przerwać proces. Program IP uzyskamy bezpośrednio z serwera http://www.poszukiwacz.pl/ wykonując ćwiczenie 9. Ćwiczenia związane z Internetowym Poszukiwaczem to ćwiczenia 6, 10.

Więcej informacji na temat IP można również znaleźć na stronach WWW. Oto jeden z adresów: http://www.pckurier.pl/inetools/polszuk.html [10.03.2002] lub http://www.poszukiwacz.pl/ - help [10.03.2002]  http://www.pckurier.pl/podreczniki/poszukiwacz/index.html  - podręcznik [10.03.2002].

Ostatnio skonstruowanym, bardzo ciekawym  narzędziem w WWW jest Serwer pozwalający na przeszukiwanie stron, zarówno szperaczy polskich, jak i obcych pod nazwą Szukaj.com http://www.szukaj.com/ [10.03.2002]. Pozwala on na korzystanie nie tylko z popularnych wyszukiwarek, lecz także daje dostęp do specjalistycznych baz np. słowników, encyklopedii, adresów e-mail itp. Jednakże nie pozwala na wybór skomasowany, na co pozwala multiwyszukiwarka Big Hub.Com  http://www.thebighub.com/ [10.03.2002] lub polski Emulti http://www.emulti.pl/ [10.03.2002].

Poszukajmy zatem interesujących nas informacji. Będziemy je gromadzić wg określonego klucza, którym będą najczęściej używane przeze mnie adresy. A oto one:

 7.1. Adresy niektórych czasopism

***

Jeżeli, któryś z odsyłaczy do stron w tekście rozdziału nie jest aktualny i chcesz to zgłosić? Jeżeli znalazłeś ciekawy link, o którym chciałbyś nas poinformować? Kliknij.