Keeawayt
- Google on julkaissut uuden työkalun, jonka avulla käyttäjät voivat etsiä kappaleita hyräilemällä, laulamalla tai viheltämällä.
- Uusi työkalu käyttää koneoppimista sovittaakseen huminaan kappaleen yli puolen miljoonan kappaleen tietokantaan, jota päivitetään jatkuvasti.
- Googlen käyttäjät kysyvät, mikä kappale soi lähes 100 kertaa kuukaudessa.
Google on julkaissut uuden "Hum to Search" -ominaisuuden ratkaistakseen turhauttavan ongelman: kappaleen juuttuminen päähän etkä pysty ymmärtämään, mikä sen nimi on.
Ajatus hyräillä kappaleen löytämiseksi vaikuttaa uskomattoman yksinkertaiselta, joten miksi Google julkaisee tämän ominaisuuden vasta vuonna 2020? No, käy ilmi, että kappaleiden tunnistaminen tällä tavalla on itse asiassa melko monimutkaista, osittain siksi, että humatut versiomme ovat yleensä melko erilaisia kuin alkuperäinen kappale. Äskettäisessä tekstissä tekoälyblogissaan Google selittää, kuinka se korjasi tämän ongelman koneoppimisen avulla ja auttoi ihmisiä löytämään kappaleen hyräilemällä, viheltämällä tai laulamalla melodiaa, vaikka niiden esitys ei olisikaan niin tarkka.
"Hum to Search keskittyy auttamaan ihmisiä tunnistamaan ja löytämään heidän päässään juuttunutta musiikkia", Googlen tiedottaja kertoi Lifewirelle sähköpostissa.
Aloita vain humina
Googlen käyttäjät kysyvät, mikä kappale soi lähes 100 miljoonaa kertaa kuukaudessa, Aparna Chennapragada, Googlen varatoimitusjohtaja ja kuluttajaostoksista vastaava johtaja, kertoi videossa, joka esittelee useita uusia hakuominaisuuksia. Nyt on tapa selvittää se.
Hum to Search -ominaisuus on sisäänrakennettu Googlen mobiilisovellukseen, Google Search -widgetiin ja Google Assistantiin. Pääset siihen sovelluksen kautta napauttamalla mikrofonikuvaketta ja sanomalla "What’s this song?" Myös "Hae kappale" -painikkeen valitseminen toimii.
Toimikseen oikein, ominaisuus edellyttää huminaa vähintään 10-15 sekuntia. Android-käyttäjät voivat hyräillä löytääkseen kappaleita yli 20 kielellä, kun taas vain englanninkieliset kappaleet toimivat iPhonessa. Työkalu ei aina pysty tunnistamaan kappaletta heti, mutta kun se tunnistaa, tulokset ovat melko hyviä.
"Algoritmimme tunnistaa yli puolet monien muuttujien kappaleista (ääni, sävelkorkeus, äänenvoimakkuus jne.), mutta tarkkuus riippuu tietysti huminan laadusta ja tyypistä. kappaleen ja paljon muuta", Googlen tiedottaja kertoi Lifewirelle sähköpostissa. "Mutta kun se tunnistetaan, noin neljä viidestä vastauksesta on oikein."
Tämä ei kuitenkaan ole ensimmäinen kerta, kun huminaa käytetään musiikintunnistussovelluksessa. SoundHound tarjoaa samanlaisen ominaisuuden, kuten CNN Business totesi, ja se on saatavana myös Androidille ja iOS:lle. Googlen tiedottajan mukaan uusi ominaisuus ei aiheuta tietosuojaongelmia, eikä se "muuta tapaa, jolla Google käsittelee äänipohjaisia vuorovaikutuksia", he kertoivat Lifewirelle sähköpostissa.
Koneoppiminen
Konseptin yksinkertaisuudesta huolimatta sävelmän hyräileminen studiotallenteen löytämiseksi on teknisesti melko vaikeaa. Tähän on useita syitä, selittää Google Researchin Christian Frank 12. marraskuuta julkaisemassaan blogikirjoituksessa. Ensinnäkin kappaleen hyrätty versio voi poiketa suuresti varsinaisesta tallenteesta, mikä vaikeuttaa näiden kahden yhteensovittamista. Joten vaikka Shazam ja monet muut sovellukset ovat jo olemassa ravintolassa tai muussa julkisessa paikassa kuulemasi kappaleen tunnistamiseksi, voi olla mutkikkaampaa käyttää huminaa melodiaa haun perustana.
"Sanoitusten, taustalaulujen ja instrumenttien avulla musikaalin tai studiotallenteen ääni voi olla aivan erilainen kuin hyrätty kappale", Frank kirjoittaa."Virheessä tai suunnittelussa, kun joku hyräilee tulkintaansa kappaleesta, sävelkorkeus, sävellys, tempo tai rytmi voivat usein vaihdella hieman tai jopa merkittävästi."
Koska kappaleiden hyrätyt versiot voivat olla niin erilaisia kuin alkuperäiset, Frank huomauttaa, että monet aiemmat menetelmät ovat edellyttäneet, että henkilön humina on sovitettu yhteen kappaleen versiolla, jossa on vain melodia, tai kappaleeseen, joka sisältää huminaa. Tämä on tehnyt tosielämän käyttötapauksista haastavia, koska näiden kappaleiden tietokannat voivat olla rajoitettuja ja ne on päivitettävä manuaalisesti.
Google selittää, että Hum to Search -ominaisuutta varten se käyttää koneoppimismalleja äänen muuttamiseksi "numeropohjaiseksi sekvenssiksi", joka edustaa kappaleen melodiaa - sen sanomaa voidaan pitää "sormenjäljenä""
Käyttäjäystävällisempi
Googlen Hum to Search -ominaisuuden koneoppimisen käyttö tekee työkalusta lopulta paljon helpompi käyttää todellisessa maailmassa. Koska Hum to Search yhdistää hakijan humatun sävelmän todelliseen kappaleeseen, työkalu pystyy työskentelemään uusien kappaleiden kanssa niiden julkaisuhetkellä sen sijaan, että tietokanta olisi jatkuvasti päivitettävä kustakin kappaleesta humistetuilla versioilla. Lisäksi sinun ei tarvitse täydellistä sävelkorkeutta käyttääksesi sitä.
"Nykyinen järjestelmä saavuttaa korkean tarkkuustason kappaletietokannassa, joka sisältää yli puoli miljoonaa kappaletta, joita päivitämme jatkuvasti", Google sanoi Hum to Search -ilmoituksessaan. "Tällä kappalekorpuksella on vielä tilaa kasvaa sisältämään enemmän maailman monista melodioista."