Algoritmil voi saada kiinni / kenel on kovimmat rap-riimit

“Puolet räppäreist ei tajuu rimmaamisest mitään / ennen mikkiin päästämistä pitäis kirjalliset pitää”

Näin toteaa suomiräpin epäilemättä tämän hetken tunnetuin nimi, Cheek, kappaleessaan Kuka muu muka. Tässä kirjoituksessa kuvailen, miten tietokoneella voidaan löytää lyriikoissa esiintyviä riimejä automaattisesti ja tutkin, löytyykö edellä mainitulle Cheekin väitteelle katetta analysoimalla Suomen tunnetuimpien räppäreiden sanoituksia toteuttamallani tietokoneohjelmalla. Ohjelma laskee tunnistamiensa riimien pituuksia sekä arvioi artistin sanavaraston kokoa.

Riimittelyn ABC

Alkuun listaan muutamia säännönmukaisuuksia, joita olen vuosien kuuntelun saatossa havainnut rap-lyriikoissa. Räpissä riimin määritelmä on laveampi kuin esimerkiksi mitallisessa runoudessa; konsonanteilla ei ole juurikaan väliä, ja rimmaavat vokaalit voivat olla yhtä hyvin pitkiä tai lyhyitä. Näin ollen esimerkiksi sanat “ahkera” ja “laakea” muodostavat riimin.

Yksi keino, jolla räppäri voi näyttää taitonsa ja monesti myös saada biisinsä kuulostamaan paremmilta, on käyttää tuplariimejä, joissa ei rimmaa vain lainin viimeinen sana vaan kaksi viimeistä sanaa. Oppikirjaesimerkkinä tästä toimii kirjoituksen alun lainaus Cheekiltä, missä tuplariimin muodostaa sanapari “rimmaamisest mitään – kirjalliset pitää”. Tästä voi nousta vielä ns. nextille levelille muodostamalla multiriimejä, joissa useampi kuin kaksi viimeistä sanaa rimmaavat. Eikä rimmaavien sanojen tarvitse olla yksi yhteen, vaan yksi sana voi rimmata vaikkapa kahden lyhyen sanan kanssa (“ei saa – veisaa”).

Riimien automaattinen tunnistus

Seuraavaksi kuvaan Raplysaattoriksi nimeämäni ohjelman toimintaa. Jos et ole kiinnostunut teknisistä yksityiskohdista, voit hypätä suoraan seuraavaan lukuun.

Riimejä voidaan tunnistaa poistamalla lyriikoista ensin kaikki konsonantit ja tuplavokaalien jälkimmäinen vokaali ja sen jälkeen etsimällä tekstistä mahdollisimman pitkiä identtisiä vokaalijonoja. Tämän idean pohjalta toteutin ohjelman, joka toimii yleisellä tasolla seuraavalla tavalla:

  1. Käy konsonanteista ja tuplavokaaleista siivottu teksti lävitse sana sanalta.
  2. Jokaisen sanan kohdalla etsi pisin yhtenevä vokaalijono edellisen kymmenen sanan joukosta (vertaa ensin sanojen viimeisiä vokaaleja, sitten toisiksi viimeisiä ja jatka tätä, sanarajoista välittämättä, niin kauan kunnes vastaan tulee ensimmäinen eriävä vokaali).
  3. Määritä kappaleen keskimääräinen riimin pituus (=riimikerroin) laskemalla keskiarvo kunkin sanan pisimmän riimin vokaalimäärästä.

Näiden vaiheiden lisäksi ohjelma tekee alkuun muutamia esikäsittelyoperaatioita tekstille, kuten siivoaa pois kaikki välimerkit. Lisäksi ohjelma huomioi riimeissä muutamia erityistapauksia, kuten sen, että riimin alku- ja loppuosa eivät voi päättyä samaan sanaan (esimerkiksi kertosäkeistössä toistetaan tavallisesti samaa lausetta monta kertaa, mutta näitä toistoja ei voida laskea riimeiksi).

Tyypillisesti suurin osa riimeistä sijoittuu lainien loppuun, mutta koska lainien rajojen tunnistaminen tekstistä automaattisesti on haastavaa, ohjelma laskee pisimmän riimin jokaiselle sanalle. Tästä syystä mukaan tulee varmasti laskettua joitakin vokaaleiltaan yhteneviä sanoja, joita artisti ei ole tarkoittanut riimeiksi, mikä lisää pientä kohinaa kappaleesta laskettuun riimikertoimeen. Kohinan vähentämiseksi ohjelma jättääkin huomiotta yhden vokaalin mittaiset riimit, koska tarkoitukselliset riimit ovat harvoin näin lyhyitä.

Suomen pisimmät riimit kirjoittaa…?

Artistin riimikertoimen laskemiseksi tein lisäksi toisen ohjelman, joka hakee automaattisesti halutun artistin kaikkien saatavilla olevien kappaleiden sanoitukset eräältä lyriikoita tarjoavalta sivustolta. Sen jälkeen laskin Raplysaattorilla artistin jokaisen kappaleen riimikertoimen (riimien keskimääräisen pituuden) ja otin näistä keskiarvon. Alla olevassa taulukossa on listattu tarkastelemani artistit sekä heidän keskimääräiset riimikertoimensa.

Sijoitus Artisti Riimikerroin
1. Skandaali 1.429
2. Altis 1.427
3. Huge L 1.224
4. Paleface 1.222
5. Cheek 1.193
6. Sere 1.110
7. Brädi 1.060
8. Asa 0.995
9. Jodarok 0.986
10. Aste 0.973
11. Heikki Kuula 0.970
12. Sini Sabotage 0.961
13. Tuomas Kauhanen 0.957
14. JVG 0.937
15. Juju 0.923
16. Are 0.919
17. Mikael Gabriel 0.904
18. Pyhimys 0.891
19. Steen1 0.874
20. Stig 0.874
21. Uniikki 0.869
22. Stepa 0.863
23. Raptori 0.861
24. Timo Pieni Huijaus 0.853
25. Spekti 0.843
26. Juno 0.840
27. Elastinen 0.839
28. Stepa 0.835
29. Juice Leskinen 0.817
30. Lavis 0.817
31. Iso H 0.813
32. Tuuttimörkö 0.806
33. Jukka Poika 0.797
34. Petri Nygård 0.786
35. Ruudolf 0.751

Tuloksista nähdään, että viiden kärki erottuu selkeästi muista artisteista. Cheekin riimikerroin 1.2 on samaa luokkaa kuin Palefacen (vain suomenkieliset kappaleet huomioitu) ja Huge L:n kertoimet, mutta näistä vielä selvästi ylempänä löytyvät Skandaali ja Altis 1.4:n riimikertoimilla. Näistä artisteista ainakaan Huge L ja Altis eivät liene vielä noussut suuren yleisön tietoisuuteen ja Skandaalinkin toistaiseksi ainoat albumit on julkaistu jo vuosina 2003 sekä 2004. Toisaalta myös listan häntäpäästä löytyy yllätyksiä kuten se, että aivan Suomen tunnetuimpien räppärien joukkoon lukeutuva Elastinen on vasta sijalla 27.

Alle olen listannut muutamia Raplysaattorin löytämiä riimejä neljältä kärkiartistilta (rimmaava osuus lihavoitu):

Skandaali – Sun Muijas: “Sama mitä tuut tekemään, se pitää must enemmän / en sitä tuu menettää, se pistää sut menemään (riimin pituus 13 vokaalia)

Altis – Riivaaja: “Meen varaa huoneen saan samal vuoteen / ku voin ajaa huomen taas takas suomeen (riimin pituus 11 vokaalia)

Huge L – Eino-Leevi: “Vois kerran päiväs punnertaa, sen verran verbaalil tasol taas / ku alan sanottaa, teen herra kenraalist alokkaan (riimin pituus 10 vokaalia)

Paleface – Riisto Räppääjä: “Vihollisten erona on kokardien soikeus / oman käden oikeuskin on totaalinen poikkeus (riimin pituus 9 vokaalia)

Cheek – Jare Henrik Tiihonen: “Nöyrästi loskas Jarena kohti kevättä tarvon / kunnes illal stagella rotsi levällään taas on (riimin pituus 11 vokaalia)

Vähätteleekö Cheek taitojaan?

Elina Westinen on tutkinut väitöskirjatyössään kolmea suomalaista rap-artistia: Cheekiä, Pyhimystä ja Stepaa. Eräässä Westisen tekemässä haastattelussa Cheek kommentoi kollegoidensa kykyjä seuraavanlaisesti (Westinen 2014, 273):

“Pyhimyshän on niinku hyvä ja […] mut Stepa ni ei osaa mitää […] mä voisin verrata sitä niinku semmoseen just mitä ite teki joku kymmenen vuot sitte”.

Cheekin väite Stepan taidoista tai niiden puutteesta kuulostaa äkkiseltään hyvin ylimieliseltä. Riimikerroinvertailun perusteella sille löytyy kuitenkin näyttöä: Stepa sijoittuu riimikerroinvertailussa kolmanneksi viimeiseksi (sijalle 21.), kun taas Cheek itse on 4. sijalla. Mielenkiintoinen havainto on se, että Cheekin jo vuonna 2004 julkaistun albumin Avaimet Mun Kulmille riimikerroin on 1.25, joka on suurempi kuin hänen uusimman Kuka muu muka -nimisen levynsä riimikerroin 1.15. Tämän valossa Cheekin rinnastus Stepan taitojen ja hänen omien kymmenen vuoden takaisten kykyjensä välillä näyttäytyykin yllättäen vaatimattomana! Toisaalta voidaan kysyä, ovatko Cheekin omat lyyriset taidot kehittyneet ollenkaan viimeisten kymmenen vuoden aikana.

“Sanavarasto rajaton, taatusti voittamaton”

Rimmaavuuden lisäksi halusin tutkia myös sanoitusten sisältöä. Tämän mittaamiseksi laskin räppäreille seuraavan luvun: kuinka monta eri eli uniikkia sanaa esiintyy artistin kirjoittamien viimeisten 9000 sanan joukossa. Tämä mittari kuvaa sitä, kuinka suuri sanavarasto artistilla on käytössään. Vastaavaa menetelmää on aiemmin sovellettu englanninkielisille rap-sanoituksille.

Yhdeksäntuhatta sanaa vastaa noin kahta suomenkielistä albumia. Ne artistit, joiden sanoituksia ei löytynyt riittävästi, jätettiin analyysin ulkopuolelle. Sanojen eri taivutusmuodot on laskettu omiksi sanoikseen, koska slangikielisten sanojen perusmuotoja on haastavaa selvittää koneellisesti. Alla olevasta kuvasta löytyvät neljäntoista suomalaisen artistin uniikkien sanojen määrät sekä riimikertoimet. Kuvasta nähdään, että suurimmalla osalla artisteista uniikkien sanojen määrä on 3500-4500 sanan välillä, mutta joukosta erottuu kuitenkin yksi artisti, Asa, jolla uniikkeja sanoja on peräti 5607. Uskon, että yhtenä selityksenä tälle on se, että Asalla sanoitusten aihepiirit eivät rajoitu pelkästään esimerkiksi naisiin ja autoihin.

artists_2d1

Huomaa, että kuvassa näkyvät lukemat eivät kuvaa suoraan artistin sanavaraston absoluuttista kokoa, sillä esimerkiksi autost ja autoon lasketaan erillisiksi sanoiksi. Eri artistien uniikkien sanojen määriä vertailemalla voidaan kuitenkin selvittää, miten artistien sanavarastojen koot suhteutuvat toisiinsa, sillä kaikilla voitaneen olettaa esiintyvän sanojen taivutusmuotoja samassa suhteessa. Kokonaisuudessaan ne artistit, jotka pääsevät lähimmäksi kuvaajan oikeaa yläkulmaa, ovat näillä kahdella mittarilla mitattuna verbaalisesti taitavimpia. Yläkulmassa ammottava tyhjä aukko antaa ymmärtää, että Suomen rap-skenessä olisi vielä tilaa sellaiselle artistille, joka yhdistäisi Asan monipuolisuuden ja Skandaalin riimittelytaidot!

Lopuksi

Räppäreitä vertaillaan usein sen perusteella, kenellä on paras flow. Flowlle ei liene olemassa tarkkaa määritelmää, mutta uskon, että riimikerroin eli käytettyjen riimien pituus muodostaa siitä yhden osan. Tekijöitä on kuitenkin varmasti monia muitakin. Flown voisi sanoa kuvastavan sitä, kuinka helpolta artistin räppääminen kuulostaa ja miten sanojen rytmitys istuu yhteen taustalla soivan biitin kanssa. Omasta mielestäni esimerkiksi Ruudolfilla, joka jää riimikerroinvertailussa viimeiseksi, on parempi flow kuin monilla muilla listalta löytyvistä artisteista. Jatkotutkimuksen aiheeksi jääkin selvittää, millä muilla mittareilla artistin flowta voisi mitata.

P.S. Jos tämän kirjoituksen sattuu lukemaan joku, jolla on syvempää näkemystä rap-sanoitusten tekemisestä, kuulisin mielelläni ideoitasi!

(Päivitys 7.9.2014: Riimikertoimia voi nyt laskea itse osoitteessa raplysaattori.fi. Lähdekoodi saatavilla GitHubissa.)

(Päivitys 27.8.2014: Lisäsin joitain uusia artisteja riimikerroinvertailuun ja päivitin tekstiä sen mukaisesti. Aion julkaista lähiaikoina nettisivun, jossa voit laskea riimikertoimen haluamillesi sanoituksille. Lisäksi aion laittaa ohjelman lähdekoodin julkiseen jakoon. Jos haluat saada jatkossa tietoa näistä tai muista blogiini liittyvistä päivityksistä, käy tykkäämässä FB-sivustani.)

Lähteet:

Westinen, Elina. The discursive construction of authenticity: resources, scales and polycentricity in Finnish hip hop culture. PhD thesis, University of Jyväskylä, 2014.

102 thoughts on “Algoritmil voi saada kiinni / kenel on kovimmat rap-riimit

    • Hyvä, jos on iloks! 🙂 Saatan tehä jossain kohtaa myös sellasen nettisivun, johon voi pasteta haluamansa lyriikat ja laskea niille riimikertoimen.

      Like

    • Kiitti ideasta, olin kokonaan unohtanut Altiksen! Laskin nopeesti Altikselle riimikertoimen ja tulos oli: 1.43 eli ihan samoissa, kun Skandaalilla! Pyrin päivittämään postauksen huomisen aikana..

      Like

  1. Tosi siisti artikkeli! Jos millään löytyy aikaa taikka jaksamista katsos nikke ankaran “aivotonta räpätiräpää” pätkien riimit tai gettomasan “lopun alku”. Teknisimpiä suomi biisejä!

    Like

  2. Ottaako raplysaattori siis eri artisteilta eri määrän biisejä ja analysoi ne? omasta mielestä loogisempaa olisi ottaa jokaiselta arkistilta joku vakiomäärä, esimerkiksi satunnaisesti 10, sillä Cheekillä löytyy varmasti enemmän ylöskirjoitettua lyriikkaa internetistä kun näillä pienemmillä artisteilla, aiheuttaen ehkäpä epäreilun(?) vertailun.

    Mielenkiintoista kuitenkin, hyvää työtä!

    Like

    • Raplysaattori ottaa eri määrän biisejä eri artisteilta, saatavuuden mukaan, mutta näistä lasketaan keskiarvo, joten sillä ei ole väliä.

      Like

      • On periaatteessa, jos vaikka jonkun artistin otannassa sattuu olemaan esim. pelkästään vanhoja biisejä jotka ovat riimillisesti tönkköjä. Ja joskus riimien monimuotoisuus vaihtelee paljonkin eri kappaleiden välillä.

        Tätähän voisi testata esim. ottamalla satunnaisesti ekaksi 10 kappaletta, laskea niitten keskiarvot, sitten 20 kappaletta, laskea niitten keskiarvot, sitten 30 jne. tai kuinka paljon nyt löytääkään yhdeltä artistilta.

        Like

  3. Ois kova, jos pistäsit ton ohjelman netii, ja sit porukka kävis postaa biisien lyriikoita sinne, ja sit se ottais niist ne kertoimet talteen, laskis keskiarvot ja päivittelis eri räppäreitä ja niiden biisien keskiarvoja listaan. Sit antais varmasti paljon kattavamman kuvan koko suomen räppäreistä, ja päivittyis myös ug-räppärit sun muut. 😀

    Like

  4. Iha vaan näin kiinnostuneena mietin onko oma suosikkini, julma Henri, jätetty huomiotta, vai eiks sen riimikerroin yllä listoille? Toinen joka jäi mietityttää on tuuttimörkö.

    Like

    • Miten sä sotket sen hiihtopiposen määkijän tähän aiheeseen , kun kaveri saa hädin tuskin lainin viimesetkään sanat rimmaamaan? Sama juttu joku Steen1, jonka riimit on tällasii ku “ongelma / pillulla” ja “Helsingissä / päässä”. Tuuttimörkö ei ole riimeistä kuullutkaan ja sen epämusiikkinsa ohella lienee varmasti suomiräpin huonoimpia kirjoittajia.

      Riimit ja lyriikka on kaks eri asiaa. Henkka ja Tuuttis ei omista minkäänlaista vainua kummastakaan, imo.

      Like

  5. Kokeilehan laskea Gettomasan riimikertoimia. Gettomasa julkas hiljattain albumin tuottaja Ruubenin kanssa nimeltään Vellamo LP.
    Underground piireissä melko pidetty riimittelijä nimittäin ja varmaan hyvin sijoittuukin.

    Like

  6. Mahtavaa! Lisäiletkö vielä kosolaa ja solosta, voisin kuvitella että freestyle taustan ansiosta sijoituu aika korkeelle. Tosin ruudolfkin sija tuli yllätyksenä joten voi olla ettei oo vaan päässy listalle.

    Like

  7. Ihan mahtava kirjoitus ja näin rap-artistin mielestä erittäin osuva ja toimiva analyysi sanoituksista joista moni kuuntelijakaan ei tunnu mitään välillä tajuavan.

    Like

  8. joo altis ja nikke ankara ois kanssa hyvä ottaa tähä mukaa.

    Flown on lausunta metodi jolla saada kuulostamaan sanat matchaavilta

    Eli riimien soveltaminen omalle kielelle, aksentille ja murteelle sopivaksi?

    Like

  9. Alkusoinnut ovat perinteisesti suomenkielisessa runoudessa olleet tärkeämpiä kuin loppusoinnut, ja olen huomannut että jotkut räppärit ovat hoksanneet tämän. Saisiko algoritmin tunnistamaan myös alkusoinnun?

    Like

    • Totta, itsekin olen huomannut niiden käytön ainakin Asan biiseissä. Ei vaatisi hirveän isoja muutoksia, että saisi tunnistamaan myös alkusoinnut, mutta tällä hetkellä se ei ole valitettavasti vielä toteutettuna.

      Like

  10. Riimikerroin kuulostaa jotenkin epäilyttävältä mittayksiköltä. Cheekin tapauksessa esimerkiksi riimit ovat usein niin simppeleitä, että riimittely on helppoa. Mielenkiintoinen juttu kyllä.

    Like

  11. Tuo Altis kannataa kyllä lisätä. Hyvä ja mielenkiintonen juttu!
    Mutta esim. Stepa käyttää biiseissä “Gettounelmii” “Mortteli” ja “Mist sä tuut” sen uutta tyyliä eli tekee monta peräkkäistä lainia samalla loppusointumallilla. Ne ei oo multirimmausta mutta silti ei ihan kaikista epälyyrisin ja -verbaalisin kaveri tuo Stepa ole.

    Lisää vielä jotkut näistä ihan vertailun vuoksi :
    Särre
    Kosola
    Solonen
    Kajo
    S-molli
    Mängi (Konala Cartelli)
    Rivo
    Ironine

    Mängin verse Konala Cartellin “Sydän”-kappaleessa :

    Ootsä ihan kiva mut en todellakaan rakasta
    Sitkun en enää jaksa lisää kortteja saa pakasta
    Mä oon talonmies siks ei portteja vaan lakasta
    Mut saan sut kiintyy lisää aina olemalla kamala
    Olemalla kavala siitä potematta darraakaan
    Sotkemalla asiat siitä olematta paskana
    Helppo päästää irti jos on onnen kanssa hatara
    Jos on nopeet jalat alla ja polkemalla satamaan
    Vaikka sanot et oon komea ja mahtava
    Oot korvikkeena paska ja komennat mut kasvamaan
    Ehkä aikanaan ostettava barbara
    Jos et tajuu ettei tää oo todellakaan vakavaa
    On korkee aika valita jos en anna halata
    Haluutko tätä juttuu jos ei ongelmaa vaan ratkasta
    Kun sä tarviit läheisyyt oon possen kans kaatamas
    Tajuu ettet musta oo saamas todellakaan rakasta

    Like

  12. Sääli, ettei Palefacea ole tuossa sanavaraston laajuudesta kertovassa kuvassa, väittäisin että se täyttäis vähä tuota tyhjyyttään ammottavaa oikeaa ylälohkoa.

    Like

      • Mulla on Palefacella lyriikoita saatavilla vain reilun 2000 sanan verran, minkä vuoksi en voinut laskea hänelle vertailukelpoista uniikkien sanojen määrää.

        Like

  13. Flowtahan voisi periaattees määritellä sillä, että kuinka monta sanaa tietyssä aikamääreessä räppäri sylkee pihalle. Tai muutenki räppärien biisien sanamäärien statiikkaa voisi olla mielenkiintoisaa selailtavaa.

    Like

  14. Koska JVG näköjään on listattu bändinä niin Ruger Hauer olisi kyllä mielenkiintoista nähdä. Samoin tietty VIlleGalle, Jare ja Paperi T sooloina. Papru tosin varmaan vähän vaikea koska jos Paavoharjun levyä ei lasketa niin ei ole soolona missään. Kuitenkin kolmesta Ruugerista, sekä Khidin ja Paavoharjun kanssa tehdyistä levyistä luulisi löytyvän sen verran matskua että saisi tuon tehtyä.

    Like

  15. Ei voi olla mahdollista.. Onko niin, että tää algoritmi ei ota huomioon sitä seikkaa, että moni noista “häntäpään” räppäreistä käyttää räpeissään monesti riimimuotoa ABAB eli ne ns. rimmaa toistensa yli?

    Like

    • Kyllä algoritmi huomioi nuokin riimit, kunhan eka ja toka A eivät ole liian kaukana toisistaan (olen asettanut tällä hetkellä maksimietäisyydeksi 10 sanaa). Tässä tapauksessa laini saa saman riimikertoimen kuin jos se olisi muodossa AABB.

      Like

  16. Tällä mittarilla on oikeasti mahdotonta mitata räppärin teknistä taitoa. Monethan pystyvät halutessaan rimmaamaan kokonaisia lauseita jos tahtovat, mutta silloin usein sanoma ei tee järkevää logiikkaa/kuulostaa tönköltä. Oikeaa taitoa onkin luoda tekninen riimi samalla pitäen kerronta järkevän kuuloisena ja kompromisoimatta riimissä heitettyä läppää. Lisäksi monet Cheekin ja Skandaalin (mitään häneltä pois ottaen, tuotannon ollessa niin vanhaa) käyttämät riimisanat ovat usein helpostikeksittäviä riimisanoja, mitkä he ovat vaan stäkänneet multiriimeiksi. Itse kuunnellen muiden räppejä näin tekijän näkökulmasta saatan usein miettiä, että itsellenikin olisi voinut täysin freestylellä tulla ensimmäisenä mieleen tuo täysin sama riimi. Pointti = tuplariimikin voi olla helppo riimi.

    Ennen käyttämättömien riimisanojen keksiminen on oikeaa riimillistä luovuutta. Harva räppäri oikeasti pystyy tähän, vielä harvempi onnistuu samalla tekemään riimeistä multiriimejä ja vain murto-osa samalla pitämään myös sisällön järkevänä. Suomen ylivoimaisesti aliarvostetuin räppäri Are on Suomessa täysin omalla tasollaan tässä. Jos et usko, niin tarkasta alta. Tämä kappale pesee riimikertoimeltaan vertailussa jokaisen tämän listan räppärin minkä tahansa kappaleen ja sisältää samalla Suomen kekseliäimpiä punchline vitsejä.

    Like

  17. Ensimmäisenä haluun kiittää artikkelista ja aiheen nostamisesta tapetille. Nykypäivän huomattavan etelävaikutteisissa raptrendeissä tekninen lyriikka, riimit ja sanaleikit ovat aivan liian niukassa.

    Itse kirjoitukseen olisin toivonut listalle enemmän artisteja ja jäi harmittamaan kun tykeimmät sointujat jäivät mainitsematta. Komppaan edellisiä kirjoittajia, listalle siis.

    Altis
    Kajo
    S-molli
    Ironine

    + mainitsematta jäi jotain niinkin tärkeitä riimittelyn osalta kuin

    Ambassa
    Sere
    Edorf
    Eino Antiwäkki
    Nikke Ankara

    -LL

    Like

  18. Mielenkiintoista tavaraa! Kiitos tästä. Facebookin puolella joku ihmetteli, mahtaako algoritmi huomioida ABAB-tyyppiset riimit, eli 1. ja 3. rivi rimmaavat keskenään ja 2. ja 4. rivi keskenään? Tämä lienee yleisin kuvio peräkkäisten rivien rimmaamisen jälkeen.

    Flowta ei oikein taida voida sanojen määrällä määrittää (tai oikein millään muullakaan teknisellä määreellä; sekä hidas ja monotoninen että nopea ja värikäs voi olla helvetin kova), mutta kyllähän siitäkin mielenkiintoista dataa voisi saada.

    Like

    • Algoritmi huomioi ABAB-tyyppiset riimit, kunhan eka ja toka A eivät ole liian kaukana toisistaan (olen asettanut tällä hetkellä maksimietäisyydeksi 10 sanaa). Tässä tapauksessa laini saa saman riimikertoimen kuin jos se olisi muodossa AABB.

      Like

  19. Vertailun vuoksi laittaisitko analysaattoriin Juice Leskisen kappaleita? Jos kerran haetaan nerokkainta sanaseppoa ja riimittelijää. En vähättele nykyartisteja ollenkaan, Juicella oli vaan kerrassaan nerokkaita sanoituksia. Suosittelen nykyartistien perehtymään Juicen tuotantoon.

    Like

  20. Siis asahan on aivan omaa luokkaansa suomi räppäreistä. Räppääminen sulavaa ja sanojen merkitykset ovat syvällisiä ja viisaita. Myös kantaaottavuus plussaa.

    Like

  21. Yksi mielenkiintoinen mittari lisää voisi olla artistin tuotteliaisuus. Se toimisi niin, että mitattaisiin kuvaajalla räppärin aktiiviset vuodet vs. kirjoitettujen biisien määrä. Se ei tietenkään liity mitenkään laatuun, mutta kuvaajasta vois tulla ihan mielenkiintoinen vertausalusta tuolle riimikertoimelle.

    Oli muuten hyvä bloggaus, kiitos 🙂

    Like

  22. Loistavaa settiä. 😀 Raplysaattori julkiseksi, jotta pääsee kokeilemaan toimintaa livenä. MIelenkiintoinen biisi mitattavaksi olisi Stepa – Gettounelmii, sillä kyseisessä biisissä ainakin riimit kuulostavat soljuvan erittäinkin nätisti, ja rimmaavat toistensa kanssa melko hyvin. Lisäksi biisissä tuntuisi olevan kohtalaisesti “uniikkeja” sanoja. Tietysti lyriikan sisältö on usein eri asia, kuin riimien peräkkäisyys, kuten juurikin tuossa Stepan biisissä. Mitenkään biisin lyriikkaa arvostelematta, tuntuu siinä ainakin osittain tiputeltavan “paskaa” vain tiputtelun ilosta. Hyvä biisi.

    Erittäinkin mielenkiintoista tutkimusta. Tieteen nimeen!

    Like

  23. Joo kait niitä mittareita ja mittausvlinitä pitää olla, mutt eiköhän ne löydy joka skenestä. Täähän on ihan suomenkielen sanojen ja sijamuotojn vääntelyä.
    Periaatteessa vois laatia tietokoneohjelman duunaan kertoimet vitoseen olevia lausuntoja. Sori, oon vaan niin kyyninen, miten musaa analysoidaan. Katalysoidaan, Soitetaan jos voidaan, jou.

    Like

  24. Joo mielenkiintoisina pitäisin ABAB-riimejä.
    Toivottavasti algoritmi suorittaa tuplavokaalien poiston ennen konsonanttien poistoa? Eli esim. “Kaatamalla” –> aaaa eikä pelkkä a. Tekstissä mainittu toisin päin, siksi epäilen.
    Ja alkuriimit lienee yhtä helppo vertailla kuin loppuriimitkin, koodi yleiseen kehitykseen vaan 🙂

    Like

    • Hyvä, että joku on lukenut tekstin tarkkaan! 😉 Joo, käsittelen tuon mainitsemasi tapauksen eli “Kaatamalla” –> aaaa. Laitan koodin jakoon, kunhan olen ensin dokumentoinut sen hieman paremmin.

      Algoritmi huomioi ABAB-tyyppiset riimit, kunhan eka ja toka A eivät ole liian kaukana toisistaan (olen asettanut tällä hetkellä maksimietäisyydeksi 10 sanaa). Tässä tapauksessa laini saa saman riimikertoimen kuin jos se olisi muodossa AABB.

      Like

  25. Muutama huomio:

    – Voisitko sanoa mistä lyriikat on haettu? Lähinnä kiinnostaa onko mukaan laskettu esimerkiksi Mode, Jodarok, Hannibal tai Tuuttimörkö, joiden uskoisi pärjäävän suhteellisen hyvin.

    – Voisitko myös listata sanastomäärän yhdelle akselille? Aika moni riimilistalta tippui sanamääristä pois.

    – Eräs toinen hyvän flown mittari on assonanssi, tai vaihtoehtoisesti allitteraatio. Ei ole mitään hyvää ideaa miten algoritmisesti havaita niitä, mutta oletko huomioinut ne?

    Like

  26. Mitä ystävällisimmin pyydän toistamaan kokeen niin, että mukana on myös Raptorin Jufo III. Muutoin tuomitsen tutkimuksen hömpäksi ja ylettömäksi kuraksi.

    Like

    • Raplysaattori ei toimi sellaisenaan englanninkielisille kappaleille, koska sanoja ei lausuta niin kuin ne kirjoitetaan, joten riimejä ei voi havaita yksinkertaisesti vokaaleja vertailemalla.

      Like

    • Laskin jossain kohtaa Kaija Koon riimikertoimen, joka oli 0.76. Laitan ohjelman myöhemmin jakoon, niin sitten sillä voi laskea kertoimet kenelle tahansa..

      Like

  27. Missä on Suomi-räpin grand daddy, se kaikista kovin, eli Raptori?!?!?!? Tai edes Bat&Ryyd…

    Ei näitä nykyarsisteja (sic!) jaksa kuunnella…

    Like

  28. En pysty vastaamaan jokaiseen kommenttiin erikseen, mutta tässä muutamia yleisiä vastauksia.

    Moni on ehdottanut artisteja, joille en ole laskenut riimikerrointa. Osa näistä siksi, että artistille ei löytynyt riittävästi sanoituksia (olen käyttänyt lähteenä lyric wikia -sivustoa) ja osa siksi kyseinen artisti ei ole tullut yksinkertaisesti mieleeni tuloksia laskiessani. Aion päivittää listalle joitain uusia artisteja huomisen aikana.

    Lisäksi pyrin tekemään nettisivun, jossa jokainen voi itse laskea haluamalleen biisille riimikertoimen. Laitan myös itse koodin jakoon, kunhan olen ensin dokumentoinut sen hieman paremmin.

    Like

  29. Ihan mielenkiintoista kyllä! Mutta hämää hiukan se, että riimin pituus tuntuu tässä toimivan räppääjien ranking-perusteena. Sanoisin taas, että on kohtuutonta laittaa rap-artisteja tämän perusteella paremmuusjärjestykseltä vaikuttavaan listaukseen, koska pitkä riimi ei välttämättä ole hyvä, jos soppa on sekava tai jos ajatus ei välity. Esim. tuo Cheekin 11 vokaalin riimi on musta tosi kömpelö ja ajatukseton. Miksi on “yllätys”, että Elastinen on kertoimineen alhaalla listassa?

    Like

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s