Ngram-katselutyökalun käyttäminen Google-kirjoissa

Sisällysluettelo:

Ngram-katselutyökalun käyttäminen Google-kirjoissa
Ngram-katselutyökalun käyttäminen Google-kirjoissa
Anonim

Mitä tietää

  • Kirjoita Google-kirjojen Ngram-katseluohjelmaan lause, valitse ajanjakso ja korpus, aseta tasoitustaso ja napsauta Hae paljon kirjoja.
  • Voit tarkastella tietoja. Jos haluat esimerkiksi etsiä verbimuotoa kala substantiivin kala sijaan, käytä tagia: search for fish_VERB.
  • Ngram Viewer tulostaa kaavion, joka edustaa lauseen käyttöä ajan kuluessa. Useiden lauseiden kohdalla kutakin edustaa värikoodattu viiva.

Tässä artikkelissa kerrotaan, kuinka Google-kirjojen Ngram Viewer -työkalua käytetään tutkimusten ja tehohakujen suorittamiseen.

Image
Image

Kuinka Ngram Viewer toimii

Ngrammi, jota kutsutaan myös N-grammiksi, on tekstin tai puheen sisällön tilastollinen analyysi, jonka avulla löydetään tekstistä n (luku) jonkinlaista kohdetta.

Hakukohde voi olla kaikenlaista, mukaan lukien foneemit, etuliitteet, lauseet ja kirjaimet. Vaikka Ngram on epäselvä tutkimusyhteisön ulkopuolella, sitä käytetään monilla aloilla, ja sillä on paljon vaikutuksia kehittäjiin, jotka koodaavat tietokoneohjelmia, jotka ymmärtävät luonnollista puhuttua kieltä ja reagoivat siihen.

Google-kirjojen Ngram Viewerin tapauksessa analysoitava teksti on peräisin suuresta määrästä vapaasti käytettävissä olevia kirjoja, jotka Google skannasi täyttääkseen Google-kirjojen hakukoneensa. Google Books Ngram Viewerissa Google viittaa haettavan tekstin runkoon. Ngram Viewer aggregoi kielen mukaan, vaikka voit analysoida erikseen britti- ja amerikkalaista englantia tai yhdistää ne yhteen.

  1. Siirry Google-kirjojen Ngram Vieweriin osoitteessa books.google.com/ngrams.
  2. Kirjoita mikä tahansa lause tai lauseet, joita haluat analysoida. Erottele jokainen lause pilkulla. Google ehdottaa, että "Albert Einstein, Sherlock Holmes, Frankenstein" pääset alkuun.

    NGram Viewer -hauissa kohteissa kirjainkoolla on ero, toisin kuin Googlen verkkohauissa.

  3. Valitse ajanjakso. Oletusarvo on 1800 - 2000.
  4. Valitse korpus. Voit etsiä vieraskielisiä tekstejä tai englanninkielisiä tekstejä, ja tavallisten vaihtoehtojen lisäksi saatat huomata luettelon alareunassa merkintöjä, kuten "English (2009)" tai "American English (2009)". Nämä ovat vanhoja korpuja, joita Google on sittemmin päivittänyt, mutta sinulla saattaa olla syytä tehdä vertailuja vanhoihin tietojoukkoon. Useimmat käyttäjät voivat jättää ne huomioimatta ja keskittyä uusimpiin korporeihin.
  5. Aseta tasoitustaso. Tasoitus viittaa siihen, kuinka tasainen kaavio on lopussa. Tarkin esitys heijastaa tasoitustasoa 0, mutta asetusta voi olla vaikea lukea. Oletusarvo on 3. Useimmissa tapauksissa sinun ei tarvitse säätää sitä.

  6. Paina Hae paljon kirjoja.

Googlen Ngram Viewer -sovelluksen avulla voit syventyä tietoihin. Jos haluat etsiä verbiä kala substantiivin kala sijaan, voit tehdä sen käyttämällä tunnisteita. Tässä tapauksessa haet sanalla fish_VERB.

Google tarjoaa verkkosivustollaan täydellisen luettelon komennoista ja muusta lisädokumentaatiosta käytettäväksi Ngram Viewerin kanssa.

Bottom Line

Google-kirjojen Ngram Viewer tulostaa kaavion, joka esittää tietyn lauseen käyttöä kirjoissa ajan myötä. Jos syötit useamman kuin yhden sanan tai lauseen, jokainen niistä on merkitty värikoodatulla viivalla erottelemaan muita hakutermejä. Tämä on samanlainen kuin Google Trends, vain haku kattaa pidemmän ajanjakson.

Tapaustutkimus

Harkitse tapaustutkimusta etikkapiirakoista. He mainitaan Laura Ingalls Wilderin Little House on the Prairie -sarjassa. Tutkimalla Googlen verkkohakua saadaksesi lisätietoja etikkapiirakoista paljastaa, että niitä pidetään osana amerikkalaista etelän keittiötä ja että ne on todellakin valmistettu etikasta. He kuuntelevat aikoja, jolloin kaikilla ei ollut saatavilla tuoreita tuotteita kaikkina vuodenaikoina, mutta onko se koko tarina?

Hae Google Ngram Vieweristä etikkapiirakkaa, niin näet piirakan mainintoja sekä 1800-luvun alussa että lopussa, paljon mainintoja 1940-luvulla ja yhä useammat maininnat viime aikoina. Kuitenkin tasoitustasolla 3 näet tasangon mainintojen yläpuolella 1800-luvulla. Koska tuona aikana ei juurikaan julkaistu kirjoja ja koska data on asetettu tasaiseksi, kuva vääristyy. Todennäköisesti vain yhdessä kirjassa mainittiin etikkapiirakka, ja sen keskiarvo laskettiin piikin välttämiseksi. Asettamalla tasoituksen arvoon 0, näet, että tämä on juuri näin. Piikki keskittyy vuoteen 1869, ja toinen piikki on vuosina 1897 ja 1900.

On epätodennäköistä, että kukaan ei muulloin puhunut etikkapiirakoista: Reseptejä luultavasti leijui kaikkialla, mutta ihmiset eivät kirjoittaneet niistä kirjoihin, ja se on tärkeä Ngram-hakujen rajoitus.

Suositeltava: