tisdag 30 oktober 2018

Ett uppslagsverk om språken i världen jag sedan flera år tillbaka arbetat på


Afrikaans är ett germanskt språk som utvecklat sig från holländskan och som talas i södra Afrika. Språket är för det mesta fortfarande förståeligt för holländsktalande, men har utvecklat en del egendomligheter, som inte förekommer vare sig i holländskan eller de flesta andra germanska språk. Afrikaans har med undantag av ett par hjälpverb förlorat imperfektformen och föredrar perfekt som dåtidstempus (vilket visserligen även skett bl a i en hel del tyska dialekter och talspråksvarieteter); dessutom har genusskillnaden helt försvunnit.

Språket har dubbel negation: även i så enkla meningar som ek is nie wit nie 'jag är inte vit' används två nekande ord. Är objektet till ett verb en person, markeras detta med prepositionen vir: ek ken nie vir Jan nie 'jag känner inte Johan' – ett drag som snarast påminner om romanska språk (jfr spanska no conozco a Juan med prepositionen a).

Slutljudande konsonantgrupper har i afrikaans förenklats, så att holländska ord som lucht 'luft' motsvaras av lug, contact 'kontakt' av kontak. Märk att holländskan föredrar etymologisk, afrikaans fonetisk rättskrivning. Sch- i holländskan motsvaras av sk- i afrikaans, jfr schaduw/skadu 'skugga', maatschappij/maatskappy 'bolag'.

Afrikaans är av naturliga skäl utsatt för stark engelsk påverkan, men detta beror främst på direkt talspråklig kontakt: på ett liknande sätt har den sydafrikanska engelskan tagit upp en hel del ord från afrikaans. Vetenskaplig och teknisk terminologi i afrikaans kan vara överraskande puristisk i jämförelse med holländskan – en (webb-, hyper)länk heter t ex skakel på afrikaans, men link på holländska.

Afrikaans talas i Sydafrika och Namibia inte bara av de vita boerna, utan också av s k färgade. Vissa grupper av blandat vitt och svart ursprung, som t ex de s k Rehoboth basters i Namibia eller griekwafolket i Sydafrika, uppfattar sig själva som särskilda etniska enheter, men talar afrikaans som modersmål.

En del språkvetare anser att afrikaans är en kreoliserad form av holländskan, men denna uppfattning är omstridd: under apartheidregimen förnekade den officiella afrikaansforskningen sådana påståenden kategoriskt, medan kreolistiska teorier om språkets uppkomst ofta förespråkades av politiskt oppositionella språkvetare. Det är fortfarande svårt att säga vem som har rätt: faktum kvarstår att afrikaans skiljer sig alltför mycket från holländskan för att det bara kunde bero på en avvikande blandning av nederländska dialekter, men inte så mycket som t ex typiska pidginengelskor skiljer sig från engelskan.

Ainu är ett språkligt isolat som talas av en handfull människor på ön Hokkaido i Japan. Dialekter som avviker starkt från hokkaidospråket och som kan uppfattas som besläktade språk i samma språkfamilj har av gammalt talats bl a på ön Sachalin i Ryssland, men de har dött ut under nittonhundratalet. Även hokkaidodialekten håller på att försvinna som traditionellt talspråk och modersmål, låt vara att den sedan flera årtionden tillbaka har varit föremål för intensivt språkvetenskapligt och folkloristiskt intresse. Det finns en kulturrörelse som främjar ainuspråket på Hokkaido.

Det klassiska ainuspråket var polysyntetiskt: på detta språk berättade traditionsbevararna de episka historier som utgör ainufolkets muntliga litteraturarv. Det moderna språk som ainuättlingarna i dag försöker återuppliva har mindre exotisk struktur men förfogar alltjämt bl a över ett rikt system härledda verb.

Ainu skrivs vanligen med en speciell variant av den japanska stavelseskriften katakana, men även latinska bokstäver förekommer.

Albanska talas i Albanien och Kosovo som första officiella språk, i Montenegro, Makedonien, Grekland och Italien som minoritetsspråk. Språket är indoeuropeiskt, men dess exakta förhållande till den övriga språkfamiljen är fortfarande något oklart, eftersom ordförrådet innehåller många olika skikt av lånord. Albanska dialekter indelas i geg- och toskalbanska; det officiella språket både i Albanien och Kosovo är baserat på tosk, men gegdialekten har egen litteratur och vissa traditioner som separat skriftspråk.

Albanska skrivs i dag med latinska bokstäver, men under dess historia har även grekiska, kyrilliska och arabiska bokstäver använts. Dessutom har det funnits ett par originella albanska alfabet, främst det s k Elbasanalfabetet på 1700-talet.

Aleutiska eller unangam tunuu talas av ett par hundra människor i Alaska och i Ryssland. Språket skrivs både med kyrilliska och latinska bokstäver. Det är det enda eskimåisk-aleutiska språk som inte är eskimåiskt, och trots att det bevisligen är släkt med de eskimåiska språken är det inte förståeligt vare sig för inuitisk- eller yupiqtalande. Under det ryska väldet i Alaska har aleutiskan införlivat många ryska lånord, och en stor del av de skriftliga minnesmärkena är religiöst material utarbetat av ortodoxa ryska missionärer.

Som de eskimåiska språken har även aleutiskan polysyntetisk formlära, men den saknar många typiska eskimåiska drag och böjningsformer. Ordföljden är betydligt friare i de eskimåiska språken.

Aleutiskan bör inte förväxlas med alutiiq, som är ett av yupikspråken och ingår sålunda i den eskimåiska grenen av de eskimåisk-aleutiska språken.

Altaiska är ett sydsibiriskt turkspråk som talas i Altajrepubliken i Ryssland. Det kallas även för ojrotiska, men detta namn undviks nuförtiden, eftersom det liknar alltför mycket beteckningen för en grupp mongoliska dialekter. Likheten är inte en slump, ty de altaisktalande brukade använda mongoliska som skriftspråk innan de sovjetiska myndigheterna införde det nya skriftspråket på 1920-talet. Altaiskan är sålunda starkt influerad av mongoliskan; på senare tider har givetvis ryskt inflytande gjort sig gällande i ordförrådet.

Altaiska talas av några tiotusentals människor, men alla gillar inte det altaiska standardspråket, och för en avvikande dialekt har det nyligen utvecklats eget skriftspråk.

Anishinaabe är den samlande beteckningen för en rad algonkinska språkformer som talas i Kanada och USA: den mest kända dialektgruppen kallas ojibwe (ojibway), men dessutom finns det bl a odawa (ottawa) och algonquin, som gett sitt namn åt hela språkfamiljen. Som cree är även anishinaabe en dialektkedja, där granndialekterna är sinsemellan förståeliga medan mera avlägsna dialekter i praktiken framstår som separata språk.

Anishinaabe skiljer på korta och långa vokaler och har även nasala vokaler.

Apache – Apache eller apachiska är inte ett enda språk, utan flera: med undantag av navajo kallas alla språk i den sydliga grenen av de athabaskiska språken för apachiska. Dessa kan indelas i tre undergrupper, de västliga, de östliga och prärieapachiskan: den sistnämnda språkformen, även känd som kiowaapachiskan, talas av en stam som av gammalt varit allierad med det språkligt helt obesläktade kiowafolket. Navajospråket klassificeras som ett av de västliga apachespråken; dessutom ingår den berömde hövdingen Geronimos modersmål, mescalero-chiricahuaapachiskan, i denna gren. Mescalero och chiricahua är ur förståelighetens synvinkel dialekter av samma språk, men de stammar som talar dem är av gammalt politiskt åtskilda och kulturellt distinkta, vilket innebär att apacherna själva föredrar att se dem som två närbesläktade språk; Geronimo var en chiricahuahövding. Västapachiska i egentlig mening, även kallad coyoteroapachiska, talas bl a på reservatet Fort Apache i Arizona; också detta språk har flera dialekter associerade med var sin stam. Östapachiska talas av ett par hundra jicarillaapacher i New Mexico; den lipanapachiska dialekten av östapachiska har dött ut.

Som vanligt i Nya världen är apachespråken polysyntetiska, verbcentrerade och åtminstone i viss mån tonala. De har nasala vokaler och skiljer på långa och korta vokaler.

Medan navajo alltjämt talas av mer än hundratusen människor som modersmål är de apachiska språken små och utrotningshotade eller helt utdöda, men alla språkformer har omfattande dokumentation och stammarna försöker lära ut dem till barn.

Arabiska – Arabiskan är det numerärt starkaste av alla semitiska språk och det enda med anspråk på att vara ett världsspråk. Arabiska dialekter talas i Nordafrika, Levanten, Mesopotamien och på Arabiska halvön, men dessutom förutsätts alla muslimer åtminstone kunna läsa Koranen på originalspråket. För en troende muslim är bara originaltexten helig, och översättningar till andra språk uppfattas endast som hjälpredor och förklaringar.

Skriftspråket utgår fortfarande från den klassiska arabiskan, även om modern standardarabiska inte längre är helt samma språk. Denna litterära språkform är dock mycket olik de dialekter som i dag talas i arabländerna: den som försöker uttrycka sig på klassisk arabiska i vardagssituationer kommer att bli utskrattad. Å andra sidan uppskattas det klassiska språket som en högre form av arabiskan, inte minst därför att det är språket i Koranen.

Det arabiska ordförrådet är baserat på ordstammar på (oftast) tre konsonanter. I böjningsformer och härledda ord sätts det in olika vokaler mellan dessa; likaså kan en av stamkonsonanterna fördubblas, och även prefix (förstavelser) är vanliga. En sådan här grammatik gör det svårt att anpassa främmande ord, och i litterär arabiska föredras puristiska ord härledda på arabiskt vis. I de talade dialekterna är dock lånord från västerländska språk, t ex franska och engelska, rätt vanliga. Nordafrikanska dialekter utmärker sig dessutom med influenser från berberspråken, som talas i de flesta nordafrikanska länder; andra dialekter är påverkade t ex av turkspråk eller av kontakter med persiskan.

Det finns arabiska dialekter som inte längre är i kontakt med den klassisk-arabiska skriftspråkskulturen och som sålunda har blivit helt självständiga språk, främst maltesiskan, i princip en nordafrikansk dialekt starkt påverkad av sicilianskan, italienskan och engelskan. En ”vild” arabisk dialekt är även cypriotisk arabiska, som före den turkiska invasionen av Cypern talades i byn Kormakitis i den nu turkiskt styrda delen av ön. Den cypriotisk-arabiska dialekten, som i dag håller på att dö ut, är ett oskrivet språk som av naturliga skäl är genomsyrat med grekiska lånord.

Det språk vi känner som ”arabiska” är historiskt sett nordarabiska, medan det före islams uppkomst och de muslimska erövringarna talades mycket annorlunda språkformer i södra Arabien. De arabiska dialekter som talas i den sydliga delen av den arabiska halvön uppvisar influenser från gammal sydarabiska; genuint sydarabiska språk talas fortfarande i Oman och Yemen.

Aragonesiska – Aragonesiskan är ett romanskt språk som talas i de nordligaste delarna av den spanska autonoma provinsen Aragonien. Som provensalskan har även aragonesiskan litterära anor sedan medeltiden, men den skriftliga traditionen har sedan dess gått förlorad, och dialektsplittringen har försvårat kodifieringen av ett nytt standardspråk. I dag talas aragonesiska bara av ett par tiotusen människor.

Arapaho är en gren i den algonkinska språkfamiljen, som inkluderar både arapahospråket i egentlig mening, gros ventrespråket och ett par utdöda och bristfälligt dokumenterade dialekter. Det är bara det egentliga arapahospråket som ännu talas som modersmål – av ett par hundra gamlingar i Wyoming och Oklahoma. Arapahospråket är nära släkt även med cheyenne, och de två stammarna har av gammalt varit allierade.

Armeniska – Armeniska språket hör hemma i den indoeuropeiska språkfamiljen, där det utgör en egen gren av släktträdet, låt vara att dess ordförråd varit föremål för massivt, långvarigt iranskt inflytande. Armeniska talas både i den exsovjetiska republiken Armenien och av en världsomspännande diaspora.

Språket har eget alfabet, och dess skriftliga historia börjar redan på femte århundradet e Kr. Äran för alfabetet brukar tillskrivas missionären Mesrop Masjtots, som även översatte bibeln till armeniska. Det fornarmeniska skriftspråk som då kodifierades, det så kallade grabar, förblev förhärskande ända fram till artonhundratalet, då det uppstod två moderna varianter, det väst- och det östarmeniska skriftspråket. Då hade det blivit vanligt bland armenier utan kunskaper i grabar att skriva och trycka böcker på turkiska med armeniska bokstäver, och armeniska intellektuella befarade att folkspråket skulle dö ut och ge vika för en etnolekt, en särskild armenisk turkiska, om det inte infördes ett modernt och talspråksnära skriftspråk.

Av de två skriftspråken är det det östarmeniska som används i republiken Armenien; västarmeniska talades av de armenier som fick sätta livet till i det stora folkmordet i Turkiet eller som jagades ut ur landet, och sålunda lever det västarmeniska skriftspråket vidare bara inom diasporan.

Dialekterna uppvisar både fonologiska, lexikala och grammatiska skillnader, men det mest slående är att de bokstäver som i det ena språket uttalas som tonlösa klusiler blir tonande i det andra och omvänt. Sålunda skrivs t ex ordet för 'blyertspenna' med precis samma bokstäver i väst och öst, men uttalas matit i öst och madid i väst. Förutom tonande och tonlösa finns det också en serie tonlösa aspirerade klusiler – dessa förblir lika i bägge varianterna.

Armeniskan anses av en del forskare vara närmast släkt med grekiskan, och det rika verbböjningssystemet är baserat på två stammar och två uppsättningar personändelser (samt en del sammansatta verbformer) på ett sätt som vagt påminner om grekiskan. Det armeniska ordförrådet uppvisar långvariga influenser från iranska och kaukasiska språk. Substantiv har sju kasusformer (nominativ, ackusativ, dativ, genitiv, ablativ, instrumental och lokativ). Det finns inga genusskillnader, men dock ett feminint suffix: haj 'armenier', hajuhi 'armenisk kvinna'.

Arumänskan är ett romanskt språk som mest talas i Grekland, en av flera språkformer på Balkanhalvön som är nära besläktade med rumänskan men ändå bör räknas som självständiga språk. Arumänskan har av naturliga skäl mest påverkats av grekiskan, medan den saknar de slaviska inslag som karaktäriserar den egentliga (dakiska) rumänskan. Arumänska språket har ingen officiell ställning i Grekland, men den arumänska minoriteten i den f d jugoslaviska republiken Makedonien åtnjuter vissa språkliga rättigheter på lokal eller regional nivå. Språket skrivs med ett latinskt alfabet som saknar den rumänska specialbokstaven ş. Det finns ett par hundratusen arumänsktalande, men antalet kan vara underrapporterat.

Assiniboine är ett siouxspråk som talas i Kanada och USA-delstaten Montana. Det indelas i två dialekter, som stammarna ifråga ofta omtalar som skilda språk: egentliga assiniboinespråket (i Montana) och stoney (i delstaten Alberta i Kanada). Stoneydialekten är mycket distinkt och oförståelig för dakotatalande siouxindianer, för vilka även assiniboinespråket i Montana är rätt svårt att begripa.

Stoney talas av några tusen, assiniboine i egentlig mening av några hundra människor.

Avariska Avariska kan beteckna två språk:

Historiskt: Det folkslag som historiskt kallas avarer var ett nomadfolk som på tidig medeltid härskade över de områden vi i dag kallar Ungern och Kroatien. Dessa avarer har sedan dess helt uppgått i de slaviska folken i regionen, men de talade antagligen någon sorts turkspråk, kanske snarare besläktat med tjuvasjiskan än med merparten turkspråk i dag.

Samtida: Avariska är ett nordostkaukasiskt språk som talas i den ryska delrepubliken Dagestan, där det har officiell ställning. Det är det numerärt starkaste av de kaukasiska språken i delrepubliken, och många små stammar som talar besläktade språk använder det som skriftspråk och lingua franca. Avariskan skrivs i dag med det ryska alfabetet utökat med en I-liknande bokstav som kallas paločka, men som många kaukasiska språk är den rik på konsonanter, och det behövs mångahanda kombinationer av konsonantbokstäver, paločka och mjuka eller hårda tecken för att återge dem alla i skrift. Av gammalt har givetvis även arabiska bokstäver använts, eftersom avarerna är ett muslimskt folk; också georgiskbaserade ortografier har förekommit, antagligen mest därför att det georgiska alfabetet har bokstäver för typiska kaukasiska konsonanter.

Awadhi klassificeras i Indien officiellt som en dialekt av hindi, men förr i välden var awadhi (tillsammans med den västligare dialekten brajbhasa) ett av de två ledande litteraturspråken i det nordindiska hindibältet – awadhi det östliga, brajbhasa det västliga. Awadhi talas av fyrtio miljoner människor, men uppfattas i dag som ett folkmål, t o m som ett fattigfolksspråk. Den ”hindi” som talas av den indianska befolkningen i Fijiöarna är till stor del awadhi (och bhojpuri).

Aymara (med betoningen på sista stavelsen, skrivs på spanska aymará) talas av ungefär två miljoner människor i Bolivien, Peru och Chile. Språket ingår i sin egen språkfamilj (aymara- eller aruspråken) tillsammans med jaqaru, ett litet minoritetsspråk i Peru. Aymara ansågs länge vara släkt med quechua och tillsammans med detta språk (eller denna språkgrupp) utgöra den quechumaranska språkfamiljen, men på sistone har släktskapet ifrågasatts: i stället påstås likheterna snarare bero på intensivt och långvarigt utbyte av influenser mellan dessa två grannspråk.

Aymara har agglutinerande grammatik och tillåter – i motsats till de andra infödingsspråken i Anderna – inte slutljudande konsonanter.

Azerbajdzjanska, azeriska – Azerbajdzjanskan är ett turkspråk som talas både i den exsovjetiska republiken Azerbajdzjan (tio miljoner invånare) och i den iranska regionen med samma namn. Som ett litterärt kulturspråk används den mest på den exsovjetiska sidan om gränsen, vilket innebär att det är en knapp majoritet azerbajdzansktalande som inte har tillgång till skolning och utbildning på modersmålet. Den azerbajdzjanska som talas i Iran innehåller naturligtvis färre ryska, flera persiska och arabiska låneord.

Det i Iran talade språket qashqai är mycket nära släkt med azerbajdzjanskan och utgör enligt en del forskare en dialekt av detta språk; skillnaderna torde mest bero på att qashqai är ett rent talspråk som varken standardiserats eller används i skrift.

Azerbajdzjanskan har vissa traditioner som lingua franca i Kaukasus. Många av de kaukasier som talar ett av de små språken i regionen som modersmål lär sig även azerbajdzjanska, och det förefaller att det inte bara är övergången till ryskan utan även till azerbajdzjanskan som hotar de kaukasiska minoritetsspråken. Azerbajdzjanskan är ett officiellt språk inte bara i republiken Azerbajdzjan, utan också i den språkligt mycket brokiga autonoma republiken Dagestan, som utgör en beståndsdel av Ryska federationen.

Alla turkspråk (med undantag av tjuvasjiskan) är rätt nära släkt med varandra, men azerbajdzjanskan liknar mest turkiskan i Turkiet och turkmenskan – de s k oghuzspråken. Likheten kan jämföras med de skandinaviska språken. Azerbajdzjanskan har under sin historia skrivits med arabiskt, latinskt och kyrilliskt alfabet; om man alls skriver språket i Iran gör man det med den persiska varianten av det arabiska alfabetet, men i den exsovjetiska republiken har det sovjetiska kyrilliska alfabetet fått ge vika för det latinska. I Dagestan är det kyrilliska alfabetet alltjämt brukligt. Det azerbajdzjanska latinska alfabetet är modellerat på det turkiska, men har ett par extra bokstäver: ǝ, x och q, av vilka den första inte står för den otydliga s k schvavokalen som den gör i den fonetiska skriften, utan för den vokal som skrivs med ä i svenska ord som färd och lärare. X står för ett fonem som mest liknar ett tyskt ach-ljud, och q är ett bakre, hårt, velariserat g-ljud (det som skrivs med g är en mjuk, palataliserad konsonant).

Basjkiriskan är ett turkspråk som talas i autonoma republiken Basjkirien (Basjkortostan) i Ryssland. Språket liknar mest tatariskan, som många basjkirer föredrar som litteratur- och kulturspråk. Ett utmärkande drag för språket är att det är normalt att ”läspa” på basjkiriska (som på turkmenska), dvs att bokstäverna s och z (eller deras kyrilliska motsvarigheter) uttalas som det engelska th i orden ”thick” respektive ”this”.

Baskiskan (egenbeteckning euskara) är ett språkligt isolat som talas i de baskiska provinserna vid den fransk-spanska gränsen. Baskiskan påstås ofta vara ett utomordentligt svårt språk, men det är en sanning med modifikationer: den baskiska formläran är rätt regelbunden, och medan språket har ungefär lika många kasusformer som t ex finskan, är verbmorfologin betydligt mindre komplicerad, ty de flesta verb böjs genom att kombinera particip- eller infinitivliknande former med hjälpverb. Verb med full böjning finns det bara en handfull i språket. Baskiskan är ett ergativt språk, dvs transitiva verb har en särskild subjektkasus (ergativ), medan subjektformerna till intransitiva verb står i nominativ. Den här principen tillämpas konsekvent i baskiskan, vilket är relativt sällsynt: det är vanligare med s k kluvna ergativspråk, där ergativformen endast används t ex i vissa tempus- eller aspektformer.

Baskiska talas av mindre än en miljon människor, men dialekterna är ändå många och splittrade, och influenser från översittarspråken i de två värdländerna bidrar sitt till denna förbistring. Typiskt nog har den spanska motsättningen av två olika verb 'att vara' upptagits i de spansk-baskiska dialekterna, medan denna differentiering saknas i de fransk-baskiska målen. Ett enhetligt skriftspråk, Euskara Batua, har utarbetats först på sextitalet; tidigare användes mer eller mindre standardiserade varianter av olika dialekter, och den labourdinska baskiskan i Frankrike lär fortfarande åtminstone på regional nivå åtnjuta viss prestige som alternativ till Batua.

Det baskiska ordförrådet har naturligtvis mottagit en hel del latinska, franska och spanska influenser, och även ordbildningselement inlånade från dessa språk förekommer i språket. Därför gör baskiskan ett mindre exotiskt intryck än man kanske kunde vänta sig av ett språk utan släktingar.

Bengali eller bangla är ett indoeuropeiskt språk som talas i Bangladesh och angränsande regioner i Indien, främst staten Västbengalen. Bengali talas av fler än tvåhundra miljoner människor och är sålunda ett av världens största språk, även om det inte alltid är lätt att säga var bengali slutar och ett närbesläktat grannspråk tar vid. Bengali är släkt med hindi, och de många mindre språk som talas i det nordindiska ”hindibältets” östra delar kan uppfattas som en övergångszon mellan hindi och bengali.

Bengali har eget skriftsystem som är besläktat med den i hindi använda devanagariskriften men skiljer sig ändå markant från den. Både muslimer och hinduer använder denna skrift – bengali brukar inte skrivas med det arabiska alfabetet. Även i bengali finns det betydande skillnader mellan hinduernas och muslimernas sätt att tala språket, men litteraturspråket är gemensamt och har på sistone utvecklat sig i ledigare, talspråkligare riktning.

Bengali har fyra kasusformer (nominativ, ackusativ, lokativ och genitiv). Verbböjningen är komplicerad, men till största delen rätt regelbunden: ett särdrag är att stamvokalen i verbet brukar färgas av ändelsevokalen, vilket leder till en sorts bakvänd vokalharmoni (bakvänd i jämförelse med finsk-ugriska språk och turkspråk, där det är ändelsevokalen som påverkas av stamvokalen).

Bengali är ett viktigt kulturspråk i regionen: Indiens nationalsång Jana Gana Mana är faktiskt skriven på bengali av nobelpristagaren Rabindranath Tagore, men språket i dikttexten är så rikt i sanskritiska kulturord att sången i praktiken fungerar som hindi om man bara sjunger den med detta språks ljudsystem. Som Nobelpristagare är Tagore den mest kände av de författare som skrivit på bengali, men språket har en enorm och varierande litterär tradition som förenar bl a islamiska och indiska influenser.

Bhojpuri är ett indoariskt språk som talas av nästan fyrtio miljoner människor, för det mesta i den indiska delstaten Bihar.

Bihariska eller bihari är den samlande benämningen på de indoariska språk som talas i den indiska delstaten Bihar. De viktigaste av dem är maithili, bhojpuri och magahi, men det finns även en rad mindre språkformer. Den officiella språkpolitiken i Indien har länge gått ut på att behandla biharispråken som hindidialekter; det är först år 2004 som maithili tillerkändes någon sorts officiell ställning. Det är dock fortfarande hindi som är översittarspråket i Bihar. Både maithili och bhojpuri talas av tiotals miljoner människor; magahi är något mindre.

Bihariska varieteter skrivs i dag mest med devanagaribokstäver. Maithili har egna litterära traditioner och egen skrift som kallas tirhuta och är besläktad med devanagari.

Bosniska är det sydslaviska standardspråk som används i Bosnien. Som alla andra postserbokroatiska standardspråk är även bosniskan baserad på neosjtokavisk dialekt. Som i kroatiskan återges även i bosniskan den fornslaviska jatj-vokalen med je eller ije, och likaså bibehåller både kroatiskan och bosniskan konsonanten h i ord där serbiskan utelämnar den. Ett särbosniskt drag är de många turkiska eller av turkiskan förmedlade orientaliska lånorden i bosniskan, men medan dessa accepteras i skriftspråket är de inte strikt påbjudna. Vad gäller ordförrådet i allmänhet tillåter bosniskan användningen av både serbiska och kroatiska ord; medan ordboksformerna för orden i allmänhet liknar mera de kroatiska, tenderar ordvalet att vara mera serbiskt. Bosniskan föredrar t ex de latinbaserade namnen på månaderna, som serbiskan gör.

Brahui – Brahui är ett dravidaspråk som talas i Baluchistan (en region som ligger delvis i Afghanistan, delvis i Pakistan). Språket skrivs oftast med arabiska bokstäver, men det experimenteras även med det latinska alfabetet. Brahui visar stark påverkan från baluchiskan och övriga iranska språk i regionen. Det finns antydningar att brahuifolket helt eller delvis identifierar sig etniskt med balucherna och att det pågår ett språkbyte från brahui till baluchiska, vilket innebär att språket på lång sikt är utrotningshotat.

Brajbhasha är en övergångsdialekt mellan hindi och rajasthani. Det var tidigare ett viktigt litteraturspråk, men sedan 1800-talet har det utkonkurrerats av khariboli, som utgör dialektunderlaget för de moderna standardspråken hindi och urdu. Det är fortfarande ett levande språk som talas av tjugo miljoner människor, men klassificeras officiellt som en dialekt av hindi.

Bretonskan är ett keltiskt språk som talas i Bretagne i nordvästra Frankrike, närmare sagt ett av de brittiska språken tillsammans med walesiskan (kymriskan) och cornwallskan. Av naturliga skäl har bretonskan starkt influerats av franskan, men walesisk- och cornwallsktalande kan fortfarande begripa en hel del av språket.

Bretonska språket indelas i fyra dialekter, som heter gwenedeg/vannetais, kerneveg/cornouaillais, tregerieg/trégorrois och leoneg/léonard. Dialektskillnaderna är markanta, särskilt mellan gwenedeg och de tre övriga (”KLT”), och det har varit omöjligt att utarbeta ett gemensamt standardspråk: för närvarande används två olika skriftspråk, ett för gwenedegmålen och ett annat för KLT-dialekterna.

Språket har sedan andra världskriget gått kraftigt tillbaka, och det är få barn som i dag växer upp med bretonska som första språk. En återupplivningsrörelse har växt fram, men det är osäkert om den kan rädda bretonskan. Språket talar kanske av ett par hundratusen människor som modersmål, men antalet är osäkert.

Bulgariska – Bulgariskan är ett sydslaviskt språk som är officiellt i Bulgarien och är modersmålet för den stora majoriteten av de sju miljoner som bor i landet. Dessutom talas bulgariska dialekter bl a i Grekland och Turkiet. Standardspråket i den före detta jugoslaviska republiken Makedonien omtalas ofta som bulgarisk dialekt. Bulgariskan saknar helt kasusböjning, men har utvecklat eller bibehållit många verbformer som inte finns i de flesta slaviska språk. Som vanligt i balkanska språk har även bulgariska verb förlorat infinitivformen.

Bulgariska skrivs med en variant av kyrilliska bokstäver som ligger rätt nära det ryska alfabetet; det finns ett latinskt alfabet för en marginell dialekt som talas utanför Bulgarien. I det bulgariska alfabetet används det i ryskan sällsynta hårda tecknet (ъ) till att beteckna en neutral vokal (som i den engelska obestämda artikeln a), och bokstaven щ uttalas som št, inte som šč.

Burmesiska – Burmesiskan är det officiella språket i Burma/Myanmar. Den klassificeras som ett av de tibetoburmanska språken, en gren av de sinotibetanska språken, och anses sålunda vara avlägset släkt med kinesiskan. Den burmesiska skriften ser mycket originell ut med sina runda bokstäver, som är ett arv från mon, på sin tid ett mycket inflytelserikt språk i regionen, men i dag ett förtvinande minoritetsspråk.

Standardburmesiskan är baserad på de dialekter som talas kring Irrawaddyfloden. Floden har alltid varit en viktig trafikrutt i Burma, något som bidragit till utvecklingen av ett relativt enhetligt talspråk. Dialekter som inte varit med om denna utveckling kan vara mycket avvikande: den viktigaste torde vara den arakanesiska (i delstaten Rakhine), som ibland omtalas som ett separat språk. Arakanesiskan har bibehållit r-ljudet, som i standardburmesiskan uttalas som [j]. Det här förklarar varför den gamla huvudstaden i engelskan (och därefter i svenskan) fått heta Rangoon medan den burmesiska regeringen i dag insisterar på Yangon: det är klart att de brittiska kolonialherrarna lärde sig namnet på arakanesiska och först därefter blev förtrogna med irrawaddydialekten.

Burmesiskan uppvisar stora skillnader mellan ledigt talspråk och formellt skriftspråk: namnet Burma kommer via engelskan från talspråket, medan Myanmar i princip är samma namn på bokiska. I bägge namnen står bokstaven r endast för vokalförlängning efter engelsk förebild och saknar motsvarighet i den burmesiska skriften.

Burmesiskan är ett tonspråk, och rent burmesiska ordstammar är enstaviga. Språket har dock tagit upp lånord från många håll, mest från pali och mon. Engelskan har givetvis sedan kolonialtiden också lämnat ett viktigt bidrag.

Burushaski talas i Gilgit-Baltistan (nordligaste Pakistan) av mindre än hundratusen människor. Det är ett isolat, dvs ett språk utan släktingar, men både grammatiken och ordförrådet har varit föremål för väldiga influenser från de indoeuropeiska språken i regionen, främst grannspråken shina och khowar, men också urdu, det officiella språket i Pakistan, och via urdu från engelskan.

Burushaski har fyra genusliknande substantivklasser (män, kvinnor, räknebara och abstrakta) och tre kasusformer. I stället för possessiva pronomina används gärna possessiva prefix, och t ex för benämningar på kroppsdelar är dessa absolut nödvändiga: man kan t ex inte säga ”hand” på burushaski, utan blir nödd att säga ”min (din, hans osv.) hand”.

Verbböjningen är komplicerad, men i det stora hela regelbunden. Som t ex finskan och ungerskan saknar även burushaski en motsvarighet till verbet ”att ha”, och föredrar i stället konstruktioner som ”(min egendom) är med/hos mig”.

Burushaski är inte ett litteraturspråk. Det alfabet som ibland används till att nedteckna texter på burushaski är urduvarianten av det arabisk-persiska, men västerländska forskare föredrar språkvetenskapliga transkriptioner. Det finns två eller tre distinkta dialekter.

Cebuano är ett regionalt viktigt språk i Filippinerna och talas på ön Cebu och i dess omgivning. Som det officiella språket i öriket, tagalog eller filippinskan, är cebuano ett austronesiskt (malajisk-polynesiskt) språk. Cebuano är det största av de såkallade visayanska språken, och de som talar cebuano kallar ofta sitt modersmål för binisayo, visayanska. De är ungefär tjugo miljoner till antalet, men det är ofta svårt att säga huruvida en visayansk språkform är ett skilt språk eller en dialekt av cebuano.

Chatino är en grupp på fyra nära besläktade, men bara i begränsad utsträckning sinsemellan förståeliga språkvarieteter som talas i delstaten Oaxaca i Mexiko; av dessa är det höglandschatino som talas av de flesta, ett par tiotusen människor. Chatino är ett tonspråk och har nasala vokaler.

Chatinospråken hör hemma i den oto-mangueanska språkfamiljen och är närmast besläktade med de zapotekiska språken.

Chavacano är den samlande beteckningen för de spanskbaserade kreolspråk som talas i Filippinerna. Medan den filippinska varianten av spanskan i egentlig mening nästan helt dött ut som modersmål, har kreoliserad ”bruten spanska” överlevt, mest på Zamboangahalvön i Mindanao. Alla former av chavacano är inte nödvändigtvis dialekter av samma språk, utan kan ha uppstått oberoende av varandra. Medan zamboangavarieteten fortfarande är ett livskraftigt språk har flera andra former av chavacano dött ut eller håller på att försvinna.

Cherokee är ett irokesiskt språk som talas av ett tiotusental människor främst i Oklahoma. Det skiljer sig markant från de andra irokesiska språken och skrivs med egna bokstäver. Cherokeeskriften utarbetades på 1820-talet av silversmeden Sequoyah, som veterligen inte behärskade engelska vare sig i tal eller skrift. Vissa bokstäver i hans stavelseskrift härstammar från engelskan men uttalas helt annorlunda. Skriften återspeglar inte alla kontrasterna i språket – den har t ex inga tecken för de olika tonerna, trots att cherokee är ett tonspråk där musikalisk accent kan utgöra den enda skillnaden mellan två ord.

Cherokeeskriften må ha sina brister, men på sin tid mottogs den entusiastiskt av de cherokeetalande, som snart blev läskunniga tack vare denna skrift. De producerade en så stor mängd skriftligt material på cherokee att språket i dag är mycket grundligt dokumenterat.

Cheyenne är ett algonkinskt språk som talas av ett par tusen människor i Montana och Oklahoma. Det utmärker sig med en relativt enkel ljudlära. Stammen har av gammalt varit allierat med arapahofolket, vars språk också är ett algonkinspråk men inte nödvändigtvis mycket närbesläktat.

Chhattisgarhi är ett av de indoariska språk som talas i östra delen av det nordindiska hindibältet, och det är alltjämt en kontroversiell fråga huruvida det är en dialekt av hindi eller ett eget språk. Det är ett officiellt språk i delstaten Chhattisgarh (huvudstad: Raipur) och skrivs med devanagaribokstäver. Språket har tagit emot väldiga influenser från icke-indoeuropeiska språk i omgivningen.

Chinook wawa eller chinookjargongen är ett kontaktspråk baserat på såväl lokala språk som på engelska och franska som talats i British Columbia och Oregon, dvs västra Kanada och nordvästra Förenta Staterna. I sin ursprungliga form förefaller detta pidginspråk ha uppstått redan före européernas ankomst, men när dessa väl gjort sig hemmastadda i regionen kom chinook wawa att uppta ord även från deras språk. På 1800-talet hade chinook wawa stor spridning i regionen, men sedan dess har engelskan trängt undan det. Ord från detta språk (t ex skookum 'stor, stark, kunnig, pålitlig', potlatch 'knytkalas', tyee 'ledare, förman', klootchman 'kvinna', chuck 'vatten, vattendrag', tillikum 'människa, person, personer, folk') är dock fortfarande vanliga i den engelska som talas i regionen; språket används ibland offentligt som en symbol för hembygdskärlek, och det finns en aktiv språkrörelse. Språket talas av mindre än ettusen människor som modersmål.

Comanche hör hemma i den numiska grenen av den uto-aztekiska språkfamiljen och är nära släkt med shoshone. Comanche talas bara av ett par dussin människor i Oklahoma.

Cornwallska språket är Cornwalls utdöda språk som under nittonhundratalet återuppväckts som talspråk. Cornwallskan är ett keltiskt språk och mycket nära släkt med bretonskan. Klassisk cornwallsk litteratur består av religiöst inspirerade skådespel och dikter; under nittonhundratalet har språkaktivister börjat skriva även modern prosa på återupplivad cornwallska.

Det finns flera olika former av cornwallska. Stavningen i originaltexterna var varierande och mycket engelskpåverkad; det första försöket att standardisera cornwallska, Kernewek Unys (Unified Cornish), företogs av Robert Morton Nance på 1920-talet. Hans standard gick bara ut på att normera den traditionella stavningen. En ny rättskrivning föreslogs på 1990-talet av Ken George, som introducerade Kernewek Kemmyn (Common Cornish), en ortografi som var helt hans egen och utgick från det uttal han rekonstruerat för språket. Samtidigt utvecklade Richard Gendall ett helt annorlunda standardspråk som han kallade Kernuack Nowedga (Modern Cornish). Denna variant ligger närmare den cornwallska som språkets sista infödda bärare talade än de andra språkformerna, som mest utgår från den klassiska litteraturens stil.

På sistone har det förekommit såväl försök att reformera Kernewek Unys till att stämma bättre överens med moderna språkvetenskapliga insikter som nya standardiseringssträvanden. Ändå förefaller språkrörelsen fortfarande rätt splittrad. Det här beror inte bara på skillnaderna mellan de olika rättskrivningsvarianterna, utan också på oenigheten om hur ordförrådet borde utvecklas och utvidgas. Den cornwallska som finns nedtecknad i historiska källor är rätt engelskpåverkad, och en del aktivister vill hellre låna in rent keltiska ord från de närbesläktade walesiska och bretonska språken, medan andra föredrar vad de uppfattar som genuin och autentisk cornwallska.

Ny litteratur har börjat utkomma på cornwallska, men det rör sig mest om översättningar från engelskan, t ex Skattkammarön av Robert Louis Stevenson (på cornwallska Enys Tresour), Det susar i säven av Kenneth Grahame (An Gwyns i'n Helyk), Baskervilles hund av Arthur Conan Doyle (Ky Teylu Baskerville) och Hon, eller dödsgrottorna vid Kôr av Henry Rider Haggard (Honna). Som exemplen visar är det främst populär viktoriansk litteratur som översätts, kanske därför att den på originalspråket redan är känd för de flesta och sålunda lämpligt undervisnings- och inlärningsmaterial.

Cree (eller cree-montagnais-naskapi) är ett algonkinskt språk, eller snarare en grupp sinsemellan närbesläktade dialekter, som talas av ett hundratusental människor i Kanada. Creespråket är Kanadas största infödingsspråk, om det är som ett enda språk det räknas. Dialektskillnaderna är dock stora, och något överbryggande standardspråk existerar inte. Cree skrivs ofta med en variant av den s k kanadensiska stavelseskriften, men också det latinska alfabetet förekommer. Egenbeteckningen för språket är nēhiyawēwin (på den västliga dialekten). Montagnais och naskapi är små avvikande dialekter som talas i Québec och i Labrador.

Cree är ett polysyntetiskt språk, som amerikanska infödingsspråk vanligen är. Som ett algonkinskt språk har creespråket gemensamma anor t ex med svartfotsindianernas språk (siksikaspråket), arapahospråket och cheyennespråket, men ojibwe och mikmaq är närmare släkt. Det finns en dialekt av ojibwe som tagit upp enorma influenser från cree, den s k ojicree-dialekten, ibland omtalad som ett självständigt språk. Ett annat cree-blandspråk är métis- eller michifspråket, som talas av ättlingar till franska pälsjägare och creekvinnor: det här unika språket kombinerar cree och franska så att alla substantiv härstammar från franskan och alla verb är rent creespråk.

Crow är ett siouxspråk som talas av tre-fyratusen reservatinvånare i Montana. Crow är närmast släkt med hidatsaspråket, som är betydligt mera akut utrotningshotat. Som amerikanska infödingsspråk brukar vara är även crow ett polysyntetiskt språk.

Danska talas i Danmark och i viss mån i angränsande områden i Tyskland, där det finns en dansksinnad, men tysktalande minoritet som använder danska som identitetsmarkör. Danska språket är ett skandinaviskt språk som ursprungligen är närmast släkt med svenskan, men norskan har under danska väldet kommit att likna danskan åtminstone vad gäller ordförrådet. Danskan var i århundraden kultur- och litteraturspråket i Norge, vilket ledde till att det uppstod blandade varianter och mellanting (riksmål, bokmål).

Lågtyskt inflytande har i danskan varit starkare än i svenskan; dessutom har obetonade vokaler i ord av skandinaviskt eller lågtyskt ursprung sammanfallit. Förhållandet mellan skrift- och talspråket är komplicerat, och det finns ingen särskilt entydig eller bindande uttalsnorm. Därför uppfattas danskt talspråk som obegripligt av andra skandinaver, trots att de kan lära sig läsa danska texter utan särskilda svårigheter.

Formläran är i danskan också mera reducerad än i andra skandinaviska språk. Förutom -er har substantiv i danskan pluraländelsen -e; ändelselösa pluralformer förekommer även i realgenus (dine sko 'dina skor'). Passiva verb på -s används betydligt mindre i danskan än i svenskan; i stället föredras analytiska konstruktioner (mistænkte blev anholdt 'misstänkta anhölls').

Som i svenskan används även i danskan rena vokaler (monoftonger) där nynorskan, isländskan och färöiskan har diftonger: da., sv. ren, nn. rein, isl. hreinn, fä. reinur. I (låg)tyska lånord bibehåller danskan dock diftongerna, da. rejse, sv. resa.

Ett särskilt danskt drag är det s k stød - på svenska ibland även ”stöt”. Stød motsvarar (riks)svensk akut accent: ord som historiskt sett är enstaviga har i danskan stød. Stød realiseras oftast som laryngalisering, dvs genom att låta vokalen ”färgas” av struphuvudet genom att föra stämläpparna närmare varandra.

Dena'ina eller tanaina är ett athabaskiskt språk som talas av ett hundratal eller mindre vid Cook Inlet i Alaska. Det är inte ett tonspråk. Dena'ina är närmast släkt med de andra nordathabaskiska språken.

Dhegiha är den samlande beteckningen för en undergrupp av västliga siouxspråk som i dag talas av mycket få eller är så gott som utdöda. I dhegihaspråken ingår osage, kansa, omaha, ponca och quapaw, men dessa är mycket lika varandra och omtalas ofta som dialekter, trots att stammarna ifråga föredrar att se dem som besläktade men distinkta språk. Det är också vanligt att indela dhegiha i tre språk: osage-kansa, omaha-ponca och quapaw. I dag försöker stammarna återuppliva språken.

Divehi eller maldiviska är det officiella språket i Maldiverna och skrivs med ett egenartat alfabet som kombinerar arabiska och indiska influenser. Det är ett indoariskt språk, närmast släkt med sinhalesiskan i Sri Lanka.

Dogrib eller tlicho talas vid Stora Slavsjön i Nordvästterritorierna i Kanada. De närmaste släktingarna torde vara de geografiska grannspråken slavey och denesuline, men som ett athabaskiskt språk har dogrib gemensamma anor även med apachespråken och navajo. Det engelska namnet på stammen och dess språk betyder ”en hunds revben”: enligt ursprungsmyten härstammade dogribindianerna från en magisk hund i människohamn. Dogrib talas av ett par tusen människor, och språket är fortfarande relativt livskraftigt. Språket har officiell ställning i Nordvästterritorierna i Kanada.

Embera är namnet på en grupp språkvarieteter som talas av sammanlagt ett hundratusental människor i Colombia och Panama. Tillsammans med det besläktade och geografiskt närbelägna noanamaspråket utgör embera chocospråken, en liten men självständig språkfamilj.

Engelska talas i Storbritannien och i de före detta brittiska kolonierna (Förenta staterna, Kanada, Australien, Nya Zeeland osv.); dessutom hörs och ses engelska praktiskt taget i hela världen både som lingua franca och som flärd. Engelskan är när allt kommer omkring ett västgermanskt språk och närmast släkt med frisiskan och nederländskan; den har dock tagit emot väldiga influenser från både fornskandinaviskan, den normandiska franskan och latinet, och dess formlära har förenklats betydligt i jämförelse med de övriga germanska språken. Genusskillnaden i substantiv har till exempel helt försvunnit.

Den engelska ortografin är mycket oregelbunden, vilket delvis beror på det s k stora vokalskiftet under senmedeltiden – att ord som late, fame, lame inte längre har ett långt [a:], utan diftongen [ei] är t ex en följd av detta vokalskifte – delvis på att engelskan gärna helt eller delvis bibehåller den rättskrivning inlånade ord har i långivarspråket.

Engelska dialekter är många, både i Brittiska öarna och i de före detta kolonierna. Även det skrivna standardspråket varierar en hel del mellan de olika engelsktalande länderna. Skillnaderna beror inte minst på olika lånord och främmande influenser. Spanska ord (bracero, bonanza, corral, cojones) är t ex vanligast i Förenta staterna, medan den nyzeeländska engelskan har tagit upp en hel del lånord (pakeha, tarakihi, kiwi) från maori, det nyzeeländska infödingsspråket. I Sydafrika förekommer influenser både från afrikaans (uitlander, bakkie, oom) och de lokala bantuspråken (sechaba, impi), och på Irland är det gaeliska inflytandet alltjämt starkt både i uttalet och i satsläran – uttryck som he is after doing it 'han har just gjort det' är t ex direktöversatta från iriskan (tá sé tar éis é a dhéanamh). Den irländska engelskan har dessutom av gammalt haft en bondsk och agrar prägel, och ofta är det lantliga ord av rent engelskt ursprung som upptas i ordböcker och ordlistor över ”irländsk” engelska.

Som isländskan har engelskan åtminstone i sin brittiska standardform bevarat ”läspljudet” [θ] och dess tonande motsvarighet [ð], men bägge skrivs med th i den nuvarande engelska rättskrivningen: thick, this. Tidigare har även engelskan använt den isländska bokstaven þ. Sedan dess har språket dock avskaffat praktiskt taget alla diakritiska tecken och avvikande bokstäver, låt vara att nyare franska lånord fortfarande ofta skrivs med franska specialtecken.

Esperanto är ett konstgjort språk uppfunnet av den polsk-judiske ögonläkaren Ludwik Zamenhof år 1887. Ordförrådet i esperanto härstammar för det mesta från romanska språk, men även engelskan och tyskan har lämnat ett viktigt bidrag. Zamenhof själv kallade sitt språk lingvo internacia (”det internationella språket”), men han undertecknade sina första läroböcker med pseudonymen Doktoro Esperanto, ”den förhoppningsfulle doktorn”, och sålunda kom språkrörelsen att kalla internacia lingvo för esperanto.

Esperanto har ett regelbundet och lätt inlärt böjningssystem, men grammatiken är inte tillnärmelsevis lika enkel som t ex i de spontant tillkomna pidginspråk som tjänar till kommunikation mellan olika etniska grupper. För en utomeuropeisk betraktare framstår esperanto snarare som en introduktion till europeiska språk i allmänhet än som ett neutralt språk: Zamenhof var, när allt kommer omkring, ögonläkare till yrket som inte visste mycket om språken utanför Europa. Att språket har en ackusativform med ändelse (-n för både substantiv, adjektiv och pronomina) har t ex väckt kritik, särskilt med tanke på att genitiven uttrycks med en preposition (de). Av det lilla som kvarstår av hans tidigaste skisser att döma utgick Zamenhof från en mycket latinliknande språkform för att gradvis utarbeta det till esperanto i dess färdiga form. Det latinska inflytandet kan fortfarande i viss mån skönjas t ex i verbparticipen.

Alla substantiv slutar på -o, alla adjektiv på -a, alla verbinfinitiv på -i, alla härledda adverb på -e. Substantiv och adjektiv har pluraländelsen -j och ackusativändelsen -n. Verb har presens (-as), dåtidsform (-is), futurum (-os), konditionalis (-us) och imperativ (-u). Dessutom finns det två uppsättningar particip: de passiva och de aktiva, varvid det egentliga participsuffixet (-t- för passiva, -nt- för aktiva particip) föregås av ett tempuselement (-o- för futurum, -a- för presens, -i- för dåtid) och åtföljs (vanligen) av ett adjektivsuffix.

Härledningssystemet i esperanto är mycket rikt, och med hjälp av härledningssuffix och -prefix kan man skapa nya ord som man vill: ett exempel är homaranismo, den synkretistiska religion som Zamenhof föreslog som en religiös motsvarighet till esperanto. Homo betyder 'människa', homaro 'mänskligheten' (-ar- är ett kollektivsuffix), homarano 'medlem av mänskligheten' (-an- är ett medlemskapssuffix), homaranismo är sålunda en religiös riktning, en ideologi eller en filosofi som går ut på att främst uppfatta människan som en medlem av människosläktet.

Esperanto har två diakritiska tecken: cirkumflexen, som används över vissa konsonantbokstäver: ĉ, ĝ, ĥ, ĵ, ŝ; och bågen, som används över u för att visa att det inte är stavelsebildande, utan uttalas som ett engelskt w: ŭ. Det är särskilt cirkumflexen som väckt ogillande, och flera scheman har utvecklats för att skriva esperanto utan diakritiska tecken: enligt ett av dem kan man t ex skriva ch i stället för ĉ och helt utelämna bågen; i dag använder man oftare bokstaven x för både cirkumflexen och bågen, så att t ex ĉirkaŭ 'kring, omkring' blir cxirkaux.

Esperanto är det mest framgångsrika av alla internationella hjälpspråk, men detta förefaller snarast bero på att esperantorörelsen uppstod vid en lycklig tidpunkt. Strax före esperanto hade nämligen den tyske prästen Johann Martin Schleyer offentliggjort sitt förslag till ett internationellt språk, volapük, ”världsspråket”. Schleyers språk hade inspirerat och intresserat många människor som idé, men som språk var volapük för svårt och opraktiskt för att accepteras utan reformer och förändringar, som själva uppfinnaren givetvis tillbakavisade och som anhängarna inte heller kunde enas om. När esperanto dök upp var det många volapükentusiaster som övergick till esperantorörelsen; dessutom hade oenigheterna och stridigheterna i deras egen rörelse övertygat dem att det var bättre att nöja sig med ett någorlunda acceptabelt förslag till världsspråk än att gräla i all oändlighet om vad som bäst motsvarade idealet.

Sedan dess har esperantorörelsen utvecklat sig till en internationell subkultur med egen språkvård, egna tidningar och egna bokförlag. Den modernistiske diktaren William Auld, en skotte som skrev på esperanto, nominerades t o m flera gånger till Nobelpriset i litteratur. Det förefaller snarast vara denna tradition som har gjort esperanto så mycket mera populärt och lockande än alla andra internationella hjälpspråk. Å andra sidan innebär detta att esperanto inte längre är ett språk utan kulturell bakgrund, vilket försvårar inlärningen: språket har i dag sina idiomatiska uttryck och sina inbyggda litterära anspelningar, som alla naturliga språk.

Den kritik som riktats mot esperantogrammatiken har lett till att en del esperantister föreslagit egna språk härledda från esperanto, så kallade esperantidoj (singularform esperantido). Dessa har dock för det mesta inte kunnat hävda sig länge: det mest framgångsrika av dem, ido (ordet betyder ”avkomling” både på esperanto och på ido), kan inte ens tillnärmelsevis mäta sig med esperanto vad gäller antalet talare, även om det tack vare Internet upplevt en viss renässans.

Det anses att esperanto i dag talas flytande av ungefär en miljon människor, men det bör finnas långt fler som har mindre gedigna kunskaper i språket. Några esperantister har uppfostrat sina barn med esperanto som modersmål.

Estniska talas främst i Estland, det nordligaste av de baltiska länderna, som ligger söder om Finland. Estniskan är närbesläktad med finskan, och språken är i viss mån inbördes förståeliga, men skiljer sig ändå betydligt. Det estniska ordförrådet har av gammalt varit mera mottagligt för internationella lånord; dessutom visar estniskan starkare påverkan från tyskan än finskan från svenskan, vilket syns både i ord och i fraser. Vokalharmonin har försvunnit från estniskan, men däremot spelar stadieväxlingen en ännu viktigare roll än i finskan: konsonanter kan vara korta, halvlånga eller överlånga, låt vara att rättskrivningen inte alltid skiljer på halvlånga och överlånga konsonanter. Grammatiken är mindre agglutinerande än i finskan, ty i estniskan är böjningsändelserna mera nedslitna: det som i finskan fortfarande kan analyseras som en kombination av pluraländelse och kasussuffix motsvaras i estniskan ofta av en enda, oanalyserbar ändelse.

Estniskan har under påverkan från grannspråken kommit att acceptera betoning på andra stavelser i ordet än den första, dock för det mesta i lånord. Det här är någonting finskan inte ännu tillåter. Å andra sidan är estnisk fonologi i vissa aspekter mera arkaisk än finsk dito: sålunda motsvaras de finska diftongerna uo och ie av de estniska långa vokalerna oo respektive ee (Soome 'Finland', jfr. fi. Suomi; mees 'man, karl', jfr. fi. mies).

Nordestniska dialekter har av gammalt varit mycket olika sydestniska, och det är motiverat att se de två dialektgrupperna som skilda språk. Före artonhundratalet var det sydestniskan (Dorpatestniskan) som dominerade i tryckta publikationer, men sedan dess har nordestniskan (Revalestniskan) varit det förhärskande skriftspråket. På 1900-talet har makthavarna, både under Estlands första självständighetstid och under sovjettiden, ogillat separata skriftspråkssträvanden i det sydestniska dialektområdet, men efter sovjetmaktens kollaps har sydestniskan åter kommit att odlas i litteratur. Det officiella skriftspråket är dock fortfarande nordestniska med vissa sydestniska inslag.

Setuspråket är en avvikande sydestnisk dialekt, som talas av setu- eller setofolket i sydöstra Estland. Setufolket är för det mesta av ortodox trosbekännelse, och deras förhållande till den egentliga estniska kulturen är sålunda ungefär som karelarnas till den finska.

Etruskiskan var ett kulturellt viktigt språk som talades på Apenninska halvön (Italien) innan latinet blev förhärskande där. Det finns ett antal etruskiska inskriptioner, men språket är långtifrån fullständigt förståeligt. Etruskisk kultur lämnade djupa spår i den romerska civilisationen och latinet lånade in flera nyckelord från etruskiskan (ordet person är t ex etruskiska till att börja med), men språket förefaller ha dött ut efter det första århundradet e Kr.

Etruskisk vidskepelse influerade romarnas religiösa föreställningar, och medan talspråket redan höll på att försvinna studerades etruskiska religiösa handböcker av sådana lärda mystiker som kejsar Claudius. Etruskisk litteratur, som bör ha varit omfattande, har dock gått förlorad: det som finns kvar av språket brukar vara kortfattade inskriptioner på gravstenar. Den längsta text som finns att läsa på språket, Liber Linteus, anses vara en religiös ritualhandbok eller -kalender, men kan inte riktigt översättas, eftersom inte ens specialisterna i ämnet förfogar över tillräckliga språkkunskaper.

Etruskiska språket var agglutinerande (rikt på böjningsändelser). Det förefaller att nasala och likvida konsonanter kunde vara stavelsebärande, ungefär som en del slaviska språk har ord där den enda ”vokalen” är r eller l. Vokalsystemet var rätt enkelt och obetonade vokaler tycks ha sammanfallit, åtminstone är det vanligt att de inte alltid ens skrivs. Skriften var alfabetisk, ett mellanting eller ett utvecklingsstadium mellan det grekiska och det tidiga latinska alfabetet.

Vissa forskare har föreslagit ett släktskap mellan etruskiskan och ett antal andra föga kända fornspråk vid Medelhavet. Den teoretiska språkfamilj som dessa språk ingår i kallas den tyrrheniska.

Feniciskan var ett semitiskt fornspråk som talades norr om Palestina, i ett område som ungefär motsvarar Libanon i våra dagars Mellanöstern. Feniciskan var mycket nära släkt med hebreiskan, och ur dess alfabet utvecklades både den hebreiska, den grekiska och den latinska skriften. Fenicierna var sjörövare och köpmän och grundade kolonier i Malta och Karthago. Feniciskan i Fenicien/Libanon dog ut under senantiken, den i Karthago talade s k puniska dialekten förmodas ha överlevt ända fram till sjuhundratalet.

Fijianskan är ett malajisk-polynesiskt språk som talas i Fijiöarna. Egentligen är språkformerna på öarna mycket varierande, och det är knappast ens möjligt att säga att det finns ett enda fijianskt språk; man anser till och med att de västfijianska dialekterna ingår i en annan gren av de malajisk-polynesiska språken än de egentliga polynesiska. Den fijianska som används i officiella sammanhang är dialekten på ön Bau, som är en östfijiansk språkform.

Fijianskan skiljer på korta och långa vokaler och har dessutom ett antal diftonger. Pronomina har förutom singularis och pluralis även dualis och paukalis (som uttrycker ett mindre antal än de egentliga pluralformerna). Som vanligt i denna språkfamilj skiljer fijianskan på inklusivt och exklusivt vi, dvs. ”vi (men inte du)” och ”vi (också du)” har olika pronomina.

Fijiansk hindi – Fijiansk hindi är ett indoariskt språk som talas av indiska invandrarättlingar på Fijiöarna. Det är p g a olika dialektunderlag inte samma språk som Indiens standardiserade hindi (kharibolidialekten), utan liknar mera awadhi (som i Indien mest talas i den historiska regionen Awadh i delstaten Uttar Pradesh). Både latinska bokstäver och devanagarialfabetet används till att skriva fijiansk hindi. Engelska lånord är mycket vanliga, men även det lokala språket fijianskan har bidragit med influenser. Det är nästan hälften av innevånarna i republiken Fiji som talar fijiansk hindi, eller ungefär trehundratusen människor.

Finskan är majoritetsspråket i Finland, ett finsk-ugriskt (östersjöfinskt) språk som talas av ungefär fem miljoner människor som modersmål. Estniskan är nära besläktad med finskan, men dessutom finns det en handfull mindre kända och för det mesta akut utrotningshotade östersjöfinska minoritetsspråk i Ryssland och Lettland. Finska språket har vokalharmoni baserad på skillnaden mellan främre och bakre vokaler. Böjningssystemet är agglutinerande, men inte strikt: i ordstammen sker oftast vissa förändringar, s k stadieväxlingar, framför olika böjningsändelser.

Grammatiken är rätt komplicerad med över tio kasusformer hos substantiv och en rik verbböjning med många infinitiv- och participformer som också kan böjas i kasus. Verbformer kan ofta användas som s k satsmotsvarigheter, så att det som t ex i svenskan vore en hel bisats i finskan uttrycks med en enda infinitiv- eller participform: syötyäni 'efter att ha ätit, när jag väl ätit'. Det är dock vanligare med satsmotsvarigheter i skrift- än i talspråket, som företer större typologiska likheter t ex med svenskan (på mindre litterär finska säger man hellre kun olen syönyt).

Finskan har inget verb med betydelsen 'att ha'. Det vanliga sättet att uttrycka ägande är att säga att något är eller finns hos honom: minulla on auto 'jag har bil', ordagrant 'hos mig är bil'. Det ägda är dock inte helt entydigt subjektet i sådana satser, ty personliga pronomina i sådan ställning står i objektform (ackusativ), och verbet står inte i kongruens med dem: 'du är här' heter på finska sinä olet täällä, men 'jag har dig' är inte *minulla olet sinä, utan minulla on sinut med tredjepersonsformen on '(han, hon, det) är' och ackusativformen sinut 'dig'.

Det centrala ordförrådet innehåller både gamla germanska och slaviska lån. Av germanskt ursprung är t ex kaunis 'vacker' (samma ord som svenskans skön och dess tyska motsvarighet schön), kattila 'kastrull' (sv. kittel, ty. Kessel), kuningas 'konung'; exempel på slaviska eller slaviskt förmedlade ord är veräjä 'grind' (jfr polska wierzeje), risti 'kors' (ryska krest'), pappi 'präst' (ry. pop), raamattu 'bibel' (ry. gramota 'läskunnighet; skriftstycke, dokument', ursprungligen från grekiskan). Växelverkan mellan östersjöfinska och baltiska språk har också varit betydlig, och det är särskilt lettiskan som tagit upp många lånord av östersjöfinskt ursprung.

Nya lånord kommer mest in från engelskan, men det svenska inflytandet är fortfarande igenkännligt t ex i sjöfartsterminologin (jfr tyyrpuuri 'styrbord', paapuuri 'babord'). Den puristiska traditionen är dock stark i Finland, vilket syns i att många specialtermer inom datateknologin i dag är ren finska (t ex palvelin för server, reititin för router osv). Engelska ord i finskan tenderar att uppfattas som tillfällighetslån, flärd, slang eller jargong; många väl inarbetade svenska lånord anses i dag vara ålderdomlig dialekt. Äldre lånord kan också omtolkas under engelsk påverkan: så har t ex det engelska ordet teenager översatts till finska som teini-ikäinen, där teini, som fonetiskt liknar det engelska teen-, egentligen är ett gammalt lån från svenskans djäkne.

Konsonantanhopningar i början av ordet tillåts i princip inte (låt vara att de p g a det svenska inflytandet blivit hemmastadda i många västliga dialekter), och lika främmande för språket är de tonande klusilerna b, d, g. En del rent finska ord har visserligen bokstaven d, men den fungerar egentligen bara som platshållare för alla de ljud som i dialekterna utvecklat sig från det ursprungliga [ð], så att sade 'regn' står bl a för [sare], [saje] och [sale]. (Uttalet [sade] med en tonande klusil är teoretiskt sett standardspråk, men det är långtifrån alla finsktalande som klarar av det.) Sålunda är det vanligt med sådana uttal som [kynekoloki] för gynekologi 'gynekolog', [sykoloki] för psykologi 'psykolog', [ratekia] för strategia 'strategi'; hyperkorrekta uttal som [bubi] för pubi 'pubb, krog' förekommer likaså. Även finnar med gedigen akademisk utbildning och kunskaper i främmande språk kan begå uttals- eller rättskrivningsfel i dylika ord. En orsak till att utveckla inhemska motsvarigheter till internationella ord har varit precis uttalssvårigheterna.

Det påstås gärna att den finska rättskrivningen hundraprocentigt återspeglar det bildade skriftspråksuttalet, men det här är en sanning med modifikationer. Utlänningar som studerar finska har t ex stora svårigheter med den s k gränsgeminationen (fi. rajageminaatio, jäännöslopuke, loppuhenkonen). Det här är en företeelse som förekommer efter vissa ord som slutar på vokal: historiskt sett har det funnits en konsonant efter slutvokalen, vilket hörs som konsonantförlängning i början av det åtföljande ordet. Sålunda uttalas det sammansatta ordet sadevesi 'regnvatten' (sade 'regn', vesi 'vatten') med ett långt v-ljud, [sadev:esi]; orden tule tänne! 'kom hit!' låter precis likadant som tulet tänne 'du kommer hit'.

Finskan har ett väldefinierat skriftligt standardspråk, men talspråket skiljer sig betydligt från det: räkneorden förkortas avsevärt, personliga pronomina som minä ’jag’ och sinä ’du’ blir och , frekventa verb förlorar stamkonsonanten (meen, tuun, oon 'jag går, jag kommer, jag är' i stället för de skriftspråkliga formerna menen, tulen, olen) och medan skriftspråket är ett s k pro drop-språk (dvs föredrar att utelämna personliga pronomina när entydigheten inte förutsätter dem), gäller detta inte för talspråket: de omarkerade talspråkliga motsvarigheterna till menen, tulen, olen lyder sålunda snarast mä meen, mä tuun, mä oon. Traditionella folkmål har sedan andra världskriget varit på tillbakagång, men samtidigt har det helsingforsbaserade allmänna talspråket gjort inmarsch i vad som tidigare varit skriftspråkliga domäner. För några årtionden sedan liknade t ex radiospråket mest skriftspråket läst högt, men i dag är det allt vanligare med ledigt talspråk på etermedierna.

Franska talas i Frankrike, Belgien, en del kanadensiska provinser (främst Québec) och före detta franska kolonier särskilt i Afrika. Dessutom är franskan ett av de stora europeiska kulturspråken som studeras i hela världen, även om dess stjärna sedan sjuttonhundratalet har varit i dalande i jämförelse med engelskan. Det är ett romanskt språk som till att börja med bara talades i området Île de France kring Paris men som sedan dess, ibland med mycket drastiska åtgärder, påtvingats hela landet. Franskan förklarades officiell och statsbärande i det s k Villers-Cottêretsediktet år 1539, men det var först efter franska revolutionen som överheten åtog sig att målmedvetet utrota regional- och minoritetsspråken.

Det keltiska inflytandet på franskan syns främst i att man alltjämt räknar i tjog (quatre-vingts 'åttio', ordagrant 'fyra tjog', 'fyra [gånger] tjugo', jfr iriska ceithre scór med ett engelskt lånord för 'tjugo, tjog'); det ömsesidiga inflytandet med de germanska språken har lämnat djupa spår i ordförrådet. Själva ordet allemand 'tysk' är ett lån från germanska hållet, jfr. sv. alla män. Ordet équipage, från vilket vi fått 'ekipage', härstammar faktiskt från det skandinaviska 'skepp'. Germanska lån har kommit in både från grannspråken på kontinenten och (via Normandiet) från fornnordiskan. Franskan har givetvis även tagit in en massa (ny)latinska ord: ofta existerar samma ordstam i språket både i form av ett mot populaire eller folkligt ord (métier 'yrke') som ärvts ned från vulgärlatinet och ett mot savant eller lärt ord (ministère 'regering, ministär, ministerämbete') som senare lånats in från latinet.

Engelska lån ogillas skarpt av språkvården, men är ändå relativt vanliga i dagens franska. I Kanada beror det engelska inflytandet på direkt kontakt med engelskt talspråk, och en del engelska lånord och översättningslån är väletablerade i naturligt talspråk. Skrift- och standardspråket i Québec undviker dock anglicismer, ibland även sådana som är vanliga i Frankrike: sålunda föredras fin de semaine framför week-end 'veckoslut', stationnement i stället för parking 'parkeringsplats', traversier i stället för ferry 'färja', gomme (à mâcher) i stället för chewing-gum 'tuggummi'.

Förhållandet mellan skrift- och talspråket är komplicerat, eftersom skriften i princip återspeglar språkets medeltida uttal. Många ändelser som är obligatoriska i skrift har helt och hållet försvunnit i tal. De slutljudande konsonanter som vanligen utelämnas i uttalet blir ofta hörbara framför ett ord som börjar med vokal (s k liaison). Bokstaven h uttalas aldrig, men i vissa ord (ofta germanska lånord) beter den sig som en konsonant, dvs tillåter inte liaison. Som italienskan och katalanskan skiljer franskan på slutet och öppet e (è respektive é); bokstaven c uttalas som [k] före bakre, som [s] före främre vokaler; ska man ha ett [s]-ljud före en bakre vokal, används en cedilj under c: français 'fransk'.

Frisiska kallas en grupp västgermanska språkformer som talas i nordvästra Tyskland och i den nederländska provinsen Friesland (på frisiska Fryslân). De frisiska dialekterna har inget gemensamt skriftspråk: vanligen utgår man från tre frisiska språk, nordfrisiskan i Frisiska öarna och längs en närliggande kustremsa i Tyskland, östfrisiskan (saterlandfrisiskan) i Saterland nära staden Cloppenburg på tyska fastlandet och västfrisiskan i Nederländerna. Det är det sistnämnda språket som är numerärt starkast med flera hundratusen med västfrisiskt modersmål; de två andra frisiska språken talas sammanlagt av lite över tiotusen människor.

De frisiska språkformerna har i dag officiell ställning i Tyskland och Nederländerna, men det är naturligt att de små språken i Tyskland anses akut utrotningshotade. Även det västfrisiska språket i Nederländerna är, trots att det stöds både av en aktiv kulturrörelse och av ett språkvårdsorgan, den Frisiska akademin i Leeuwarden (frisiska: Ljouwert), kringskuret av den expansiva nederländskan att dess fortlevnad ingalunda är säkrad.

De frisiska språken är historiskt sett mycket nära besläktade med engelskan: detta syns t ex i att det engelska ordet cheese 'ost' i västfrisiskan motsvaras av tsiis, medan de besläktade orden i tyskan (Käse) och nederländskan (kaas) har hårt k. I dag förstår de engelsktalande dock inte längre frisiska, eftersom det engelska ordförrådet så grundligt ommöblerats med nordiska, normandisk-franska och latinska ord.

Friuliska eller furlanska talas i de nordöstliga italienska provinserna Udine och Pordenone. Det är ett romanskt språk och klassificeras ofta som rätoromanskt, men dess exakta släktskap till den schweiziska rätoromanskan är fortfarande omstritt. I jämförelse med denna är friuliskan, som talas av en halvmiljon människor, ett stort språk. Friuliskan har påverkats både av tyskan och de slaviska varieteter som talas i det närliggande Slovenien; på sistone har det italienska inflytandet givetvis haft överhanden. Friuliskan har betydande litterära traditioner: nationaldiktaren är Ermes di Colloredo, som levde på 1600-talet, men även Pier Paolo Pasolini inledde sin författarbana som diktare på friuliska.

Fula eller fulani eller pulaar eller fulfulde är det största av de senegambiska språken, som ingår i niger-kongospråken. Fula talas av över tjugo miljoner människor på ett vitt utsträckt område i Västafrika, men av naturliga skäl är dialekterna mycket varierande, och det kan ifrågasättas om fula ur förståelighetens synvinkel är ett enda språk.

Som i bantuspråken indelas även i fula substantiven i klasser – en sorts genusliknande grupperingar, som dock i fula är fler än t o m i bantuspråken – det exakta antalet varierar i de olika fuladialekterna, men det är i alla fall över tjugo. I praktiken är det mest pluralbildningen som styrs av klasstillhörighet, och sålunda har fula fler än tjugo pluraländelser. Fula utmärks också av konsonantmutationer som påminner om de keltiska språken.

Fula kan skrivas både med latinska och med arabiska bokstäver. De flesta fulatalande torde vara muslimer, och språket har tagit upp en hel del arabiska lånord.

Gaeliska är en samlande beteckning för skotsk gaeliska, iriska och manx, som ända fram till sjuttonde århundradet hade samma skriftspråk, den klassiska nyiriskan.

Gagauziska talas av ett drygt hundratusental människor mest i Moldova. Det är ett turkspråk som är mycket nära släkt med den egentliga turkiskan och ingår sålunda i den oghuziska grenen av turkspråken. Gagauzerna är dock ett kulturellt distinkt folkslag som i motsats till de flesta andra oghuzisktalande folk inte är muslimer utan ortodoxa kristna. Gagauziskan är mest ett talspråk, och det är bara särskilda kulturaktivister som försöker främja det som skriftspråk; de flesta gagauzer föredrar ryska till skriftliga ändamål.

Galiciska talas i den spanska provinsen Galicien, numera ett autonomt landskap, som ligger norr om Portugal. Galiciska språket är mycket nära släkt med portugisiskan, och språken hade under medeltiden en gemensam skriftlig tradition. Sedan dess har de utvecklat sig åt var sitt håll, inte minst därför att galiciskan som skriftspråk trängts undan av spanskan.

I dag är galiciskan igen ett blomstrande språk med egen litteratur – prosaförfattaren Manuel Rivas är världsberömd – men galicierna är fortfarande oeniga om hur de borde utveckla sitt språk. En del, de s k reintegrationisterna, anser att språket främst är en portugisisk dialekt och att litteraturen och skriftspråket borde orientera sig till portugisiska förebilder.

Galliska – Galliska heter det fornkeltiska språk som före vulgärlatinets frammarsch talades ungefär i det område som i dag är Frankrike. Galliskan anses ha dött ut i medeltidens början, kanske på femhundratalet e Kr, men det finns bara indirekta bevis på detta, eftersom galliskan aldrig var något litteraturspråk. Det finns gott om galliska inskriptioner, men de flesta är rätt kortfattade och innehåller bara begravningsformler och liknande snuttar.

Det keltiska språk som i dag talas i Bretagne, bretonskan, är en relativt sen nykomling från Brittiska öarna och inte en nära släkting till galliskan.

Ge'ez är ett som talspråk utdött etiopiskt fornspråk som i dag mest används till liturgiska ändamål. Det finns en litteratur på ge'ez, som mest består av bibelöversättningar och kristliga skrifter. Ge'ez är nära släkt med sådana levande etiopiska språk som amhariskan, tigre och tigrinja och ingår sålunda i de semitiska språken. Som de moderna etiopiska språken skrivs även ge'ez med den etiopiska stavelseskriften.

Som i arabiskan och hebreiskan står adjektivet även i ge'ez efter huvudordet; i de moderna etiopiska språken står det däremot före substantivet, vilket beror på influenser från de omgivande språken.

Georgiska – Georgiska språket är det största och kulturellt viktigaste av de sydkaukasiska språken. Språket talas mest i den f d sovjetiska republiken Georgien och har bokstavligen en årtusendelång litterär tradition. Georgiskan skrivs med ett eget alfabet som enligt georgierna själva utarbetats av den forne georgiske konungen Parnavazi, vilket dock knappast är sant: georgisk litteratur har bevisligen uppstått efter Georgiens kristnande, medan Parnavazi levde på 200-talet f Kr.

Georgiskan är släkt med sådana mindre utbredda kaukasiska språk som mingreliska (megreliska, margaluri), svan (svanetiska) och laz, men trots att dessa tre inte är förståeliga för den som bara behärskar standardgeorgiska uppfattas de i Georgien som dialekter, och försök att utveckla eget skriftspråk för mingreliskan har väckt ont blod och misstankar om separatism.

Georgiska språket är rikt på böjningsformer. Kasusformerna är många, och skillnaden mellan postposition och kasusändelse är inte alltid tydlig, något som påminner om baskiskan och ungerskan. Likaså är verbböjningen komplicerad: ett georgiskt verb kan ha sju olika affix (förstavelser och ändelser) kring ordstammen; och i härledningssystemet är det vanligt med s k cirkumfix (kombinationer av förstavelse och ändelse). Som typiskt är för kaukasiska språk tillåter georgiskan mycket imponerande konsonantanhopningar; dessutom har den en serie ejektiva konsonanter (dvs konsonanter som uttalas med avspärrning av röstspringan).

Vad gäller ordförrådet är georgiskan dock rätt internationell: det är vanligt med både latinska, grekiska, arabiska och persiska lånord i språket. Ryska ord förekommer också, men är de rent slaviska uppfattas de vanligen som ledigt tal- och slangspråk som helst bör undvikas i skrift. Däremot har många västerländska (t ex engelska) lån förmedlats av ryskan och används i typiskt ryska betydelser (ett exempel är ordet ”kommutator” för 'telefonväxel'). Grannspråket i Armenien gör ett mycket mera obegripligt intryck fast det är ett indoeuropeiskt språk.

Gond eller gondi är ett dravidaspråk som talas av ett par miljoner människor i Indien, mest i delstaterna Madhya Pradesh och Chattisgarh. Det är bara en minoritet av den etniska gruppen gond som ännu har detta språk som modersmål, många har övergått till hindi eller andra större språk (t ex chattisgarhi). Språket är utspritt över ett stort område och dialekterna är mycket varierande, och försöken att utveckla ett gemensamt skriftligt standardspråk har tills vidare inte lett till särskilt imponerande resultat. Gond är en nära släkting till telugu.

Grekiska – Grekiska språket utgör en egen gren i det indoeuropeiska släktträdet och talas i dag mest i Grekland och Cypern. I sin antika form är grekiskan tillsammans med latinet ett av den västerländska civilisationens klassiska språk.

Den äldsta grekiskan är den mykenska, som skrevs med en stavelseskrift känd som ”Linear B”. Språkliga minnesmärken på detta språk har hittats på Kreta. Skriften ”Linear B” har utvecklat sig från ”Linear A”, som användes för att skriva det minoiska språket, grekiskans föregångare på ön. Detta språk är inte släkt med grekiskan och förblir oförståeligt för oss. Mykensk grekiska skrevs från sextonde till tolfte århundradet f Kr.

Forngrekiskan är belagd i flera dialekter, av vilka den viktigaste är den klassiska attiskan, dvs den dialekt som talades i Aten och den omgivande regionen Attika. Den klassiska grekiska diktningen begagnade sig av olika dialekter för att skilja på genre: sålunda skrevs t ex prosa mest på attiska, medan kören i ett skådespel sjöng på doriska (denna dialekt talades bl a på ön Kreta). Homeros' stora episka verk Iliaden och Odysséen har egen dialekt, en arkaisk form av joniskan med aioliska influenser.

Dialektskillnaderna i grekiskan kan illustreras med en hänvisning till den antike författaren Xenofons skildring av besegrade grekiska soldaters hemfärd från Persien efter det förlorade slaget vid Kunaxa (år 401 f Kr): när soldaterna äntligen ser havet ropar de på sitt modersmål: Thalatta, thalatta! 'Havet, havet!' På nygrekiska heter det dock inte thalatta, utan thalassa, och det här beror inte på någon språkhistorisk ljudskridning, utan på att den form nygrekiskan ärvt kommer från en annan dialekt än Xenofons, som naturligtvis skrev på klassisk attiska.

Det grekiska alfabetet uppstod på nionde eller åttonde århundradet f Kr som en lokal tillämpning av det feniciska alfabetet. Ursprungligen skrevs grekiska från höger till vänster, som feniciska och på våra dagar bl a arabiska och hebreiska, men därefter började det förekomma att man bytte riktning från rad till rad (så kallad boustrophedon- eller plöjoxskrift); sedan etablerade sig riktningen från vänster till höger.

Alexander den stores maktperiod gav upphov till en ny blanddialekt, koinégrekiskan (”den allmänna dialekten”), som för det mesta är attiska men skiljer sig markant från den klassiska varianten av denna dialekt. Koinégrekiskan var världsspråket i romerska rikets östra halva och talades vitt och brett även i angränsande länder. Nytestamentlig grekiska är också en sorts koiné, och det är från koinégrekiskan som dagens grekiska talspråk utvecklat sig. Under koinétiden förekom det redan en strävan att odla klassisk attiska som skriftspråk medan man talade koiné. En sådan här funktionell tvåspråkighet, s k diglossi, har varit utmärkande för grekiska språket ända fram till 1900-talets andra hälft.

På 1800-talet uppstod en modern standardgrekiska som dock var mycket olik det språk folk verkligen talade. I denna språkform ingick en hel del forngrekiska former som hade försvunnit från talspråket, dessutom hade turkiska lånord ersatts med puristiska termer skapade från forngrekiskt språkgods. Denna grekiska kallas katharevousa; den står i motsats till dimotiki, den folkliga grekiskan.

Språkstriden mellan katharevousa- och dimotikianhängarna präglade kulturlivet i Grekland i ett och ett halvt århundrade, och den antog politisk färgning när vänstern ville införa dimotiki, medan högern insisterade på katharevousa. Det sistnämnda var det officiella språket och tidningsspråket, skönlitteratur skrevs däremot hellre på dimotiki.

Den militärjunta som regerade Grekland i slutet av sextio- och i början av sjuttiotalet bekämpade i sin kulturpolitik aktivt dimotiki, vilket ledde till att katharevousa kom att uppfattas som ett reaktionärt och fascistiskt språk och helt och hållet förlorade sin prestige och officiella ställning när juntan väl kraschat. Det bör dock påpekas att många av de nyord som karaktäriserade katharevousa har tagits upp i dimotiki och används även i dagens grekiska.

Modern (dimotiki)grekiska har förlorat dativformen, så att substantiv bara har nominativ, ackusativ, genitiv och vokativ (tilltalskasus). Verbböjningen är baserad på två stammar, den perfektiva och imperfektiva, och två uppsättningar av ändelser, av vilka den ena är typisk för dåtids-, den andra för nutids- och framtidsformer. Infinitivet har försvunnit i modern grekiska, något som är typiskt för språken på Balkanhalvön. Formell, katharevousainfluerad dimotikigrekiska använder dock infinitiv som en sorts verbalsubstantiv t ex i offentliga förbudsskyltar.

Det finns perifera grekiska dialekter som inte har utvecklat sig från koiné och som därför inte är förståeliga för dimotikitalande greker – dessa omtalas ibland som självständiga språk. Dessa är tsakoniska (i regionen Tsakonien på Peloponnesiska halvön), pontisk grekiska (i en del f d sovjetrepubliker) och kappadokiska (tidigare i Mindre Asien; veterligen en starkt turkiskinfluerad språkform).

Tsakoniskan är i dag en lokal dialekt som bara talas av ett hundratal bönder. Pontisk grekiska förföljdes i Sovjetunionen för det mesta, och även under den period då språket främjades av sovjetstaten föredrog kommunistiska intellektuella att studera och lära ut den grekiska som talades i Grekland, inte minst för att förbereda den kommunistiska världsrevolution som en dag skulle omfatta även Grekland.

En grekisk dialekt, s k griko, talas även i enstaka byar i Syditalien. Denna dialekt är koinébaserad och har införlivat många italienska ord. I dag håller griko på att försvinna, men språket har lämnat djupa spår i de romanska dialekter som trängt undan det: ordet för den calabriska motsvarigheten till maffian, ndrangheta, är till exempel ett grekiskt lånord.

Grönländska språket är ett eskimåisk-aleutiskt språk av den inuitiska grenen som talas i Grönland. Det är det enda språk i denna språkfamilj som inte är akut utrotningshotat. Som alla eskimåisk-aleutiska språk är det ett polysyntetiskt språk med långa sammansatta ord som kan uttrycka innebörden av en hel mening.

Standardspråket är den västgrönländska dialekten kalaallisut, som talas av de flesta grönländare, ungefär femtiotusen människor. Det finns ett distinkt östgrönländskt mål, tunumiisut, tillräckligt olikt västgrönländskan för att omtalas som ett skilt språk. Kring Qaanaaq (Thule) i norra Grönland talas en annan avvikande dialekt, avanersuarmiutut, närmare besläktad med vissa varieteter i Kanada än med västgrönländskan.

Guaraní – Guaraní är det viktigaste av tupi-guaraníspråken och talas allmänt i Paraguay, där det härskar diglossi: man använder detta språk i informella sammanhang och till vardags, men övergår till spanska i formella situationer. Övergången är dock gradvis, och även ett ”spanskspråkigt” samtal paraguayaner emellan kan vara rätt svårt att förstå för en lyssnare som inte behärskar guaraní. Den hispaniserade form av guaraní som talas i städerna och av mestiserbefolkningen på landet är redan p g a kulturskillnader mycket olik de genuina indiandialekterna, och man kan säga att guaraní inte är ett språk utan flera.

Substantiv och pronomina saknar kasus- och genusformer i guaraní. Genitivattribut står oböjda framför huvudordet, så att t ex che ’jag’ också betyder ’min, mitt, mina’. Verbböjningen är däremot rik och komplicerad.

Guaraní skrivs med latinska bokstäver. De viktigaste diakritiska tecknen är tilde (~) och cirkumflex (^), som står för obetonade respektive betonade nasalvokaler. Tilde används även över g för att beteckna ett ng-ljud. Betoningen ligger för det mesta på sista stavelsen.

Gujarati – Gujarati talas mest i den indiska delstaten Gujarat och är släkt med hindi och de övriga nordindiska språken. Sålunda är det ett indoeuropeiskt språk. Gujaratiskriften är en stavelseskrift av samma ursprung som devanagari, men ser mycket annorlunda ut, eftersom den saknar den vågräta linje som förenar devanagaribokstäverna. Gujarati föredrar postpositioner framom prepositioner och har utvecklat många egna hjälpverb.

Gujarati var Mahatma (Mohandas) Gandhis modersmål, och Gandhi spelade en roll i att återuppliva gujarati som litteraturspråk.

Gwich'in är ett nordathabaskiskt språk som talas av några hundra gwich'in-indianer (en minoritet av den etniska gruppen) i Alaska och Kanada. Det är ett polysyntetiskt språk som utmärker sig med nasalvokaler och skiljer på långa och korta vokaler. Det är också ett tonspråk, men skiljer bara på hög och låg ton. Gwich'in har officiell ställning i Nordvästterritorierna i Kanada.

Haida är ett isolerat språk som talas av en handfull åldringar på Haida Gwaiiöarna (tidigare Drottning Charlottes öar, Queen Charlotte Islands) i Kanada och på Prince of Wales Island i Alaska. Haida är ett tonspråk som saknar adjektiv: dessa uttrycks med verb. Det finns ett par distinkta dialekter. Språket är såtillvida väldokumenterat att den etniska gruppen har kunnat starta ett program för att återuppliva språket och lära ut det till den unga generationen.

Halkomelem är ett salishspråk som talas i British Columbia (Kanada) och i delstaten Washington i Förenta Staterna. Det finns tre distinkta dialekter, men antalet talare är mycket lågt, låt vara att det finns en aktiv rörelse som främjar språket. Som salishspråken i allmänhet är även halkomelem ett polysyntetiskt språk rikt på konsonantanhopningar.

Hebreiskan är det språk som Gamla testamentet är avfattat på och som senare kommit att användas av diasporans judar som skriftspråk; i dag är en modern form av hebreiskan det officiella språket i Israel.

Hebreiskan är ett semitiskt språk och sålunda släkt med arabiskan, amhariskan och arameiskan. Feniciskan, som talades norr om det forna Israel, var en mycket nära släkting till hebreiskan; dessutom föreligger det inskriptioner på andra besläktade men distinkta språkformer. Hebreiskan i Gamla testamentet varierar i den mån att skillnader mellan historiska perioder kan iakttas. Största delen av de bibliska texterna anses ha uppstått ungefär sex-åtta århundraden före Kristi födelse, men det finns också äldre material, främst Deboras sång i Domarboken. Mishna, kärnan till Talmud, representerar ett senare utvecklingsstadium, men kom till då hebreiskan alltjämt var ett levande talspråk.

Hebreiskan försvann som modersmål under senantiken, då judarna gick över att tala arameiska och koinégrekiska, som var de mest utbredda talspråken i romerska imperiets östra hälft. Därefter överlevde hebreiskan bara som ett lärt skriftspråk som mest användes till religiösa ändamål.
De första försöken att återuppliva hebreiskan som ett sekulärt talspråk skedde mot slutet av sjuttonhundratalet, då den hebreiska upplysningsrörelsen Haskala kom till. Under 1800-talet började det skrivas sekulär litteratur på språket, t ex Shakespeareöversättningar, men det var först mot slutet av århundradet som moderna prosaverk – romaner och noveller – dök upp på hebreiska. Den förste prosaförfattaren i egentlig mening var Mendele Mocher Sfarim (1836-1917), som dock såg sig tvungen att återgå till jiddisch för att tilltala en större läsarkår. En kvinnlig författarpionjär var Dvora (Debora) Baron, som även utmärkte sig som flitig översättare.

Vanligen sägs det att det var språkaktivisten Eliezer Ben Yehuda som på egen hand återupplivade hebreiskan som talspråk i Palestina, men det här är en överdrift. Nuförtiden anses det att övergången till hebreiskan som gemensamt språk för Palestinas judar främst berodde på att alla judar behärskade åtminstone lite hebreiska, medan alla andra judiska språk, t o m jiddisch, var mindre universella. Ben Yehudas bidrag som ideolog och terminologiskapare var dock mycket viktigt.

I dag är hebreiskan ett levande språk som talas av majoritetsbefolkningen i Israel som modersmål. Det är dock fortfarande en öppen fråga, i vilken mån nyhebreiskan är samma språk som den klassiska bibelhebreiskan. Den israeliske språkvetaren Ghil'ad Zuckermann har till exempel framfört åsikten att vi egentligen borde använda uttrycket ”israeliska” när vi talar om nyhebreiska, ty enligt hans åsikt har den moderna hebreiskan tagit emot så väldiga influenser från indoeuropeiska språk – främst jiddisch och de slaviska språken – att den inte längre kan kallas ett semitiskt språk. Medan Zuckermanns uppfattning snarast är en retorisk överdrift, bör det medges att det europeiska inflytandet inte bara på ordförrådet, utan också på grammatiken och fraseologin har varit massivt. Verbläran har t ex omtolkats i europeisk anda.

Det hebreiska uttal som i dag är vanligast och mest prestigefyllt är också mest europeiserat. Sålunda har de ”semitiska” strupljuden försvunnit och sammanfallit med de motsvarande ”europeiska” fonemen: det bakre slutljud som skrivs med bokstaven qof har till exempel helt sammanfallit med ett vanligt [k]. De judar som kommer från arabländer har med stöd från arabiskan bibehållit många av de ”semitiska” fonemen, men hur autentisk deras hebreiska ljudlära än är har deras dialekt kommit att uppfattas som en underklassmarkör i Israel.


Hidatsa är ett utrotningshotat siouxspråk som talas av några dussin äldre stammedlemmar i delstaterna North Dakota och South Dakota i Förenta Staterna. Hidatsa är en nära släkting till crowspråket.

Hiligaynon eller ilonggo är ett regionalt språk i Filippinerna och ett av de visayanska språken, sålunda nära släkt med cebuano. Det talas av nio miljoner människor, mest på öarna Panay och Negros.

Hindi – Hindi är ett av världens största språk och det viktigaste av de s k indoariska språken, en gren av de indoeuropeiska språken vars representanter talas i Indien och i angränsande länder.

Hindi är i princip samma språk som urdu, ty bägge standardspråken är baserade på den dialekt som kallas khariboli och som av gammalt talats på landsbygden kring Delhi. När hindi och urdu uppfattas som samma språk kallas de hindustani. På folklig, talspråklig nivå skiljer sig hindi och urdu knappast från varandra, men standardspråken använder olika alfabet (hindi skrivs med devanagaribokstäver, urdu med en variant av det persisk-arabiska skriftsystemet) och olika litterära konventioner. I sin litterära form innehåller hindi också kulturord från det indiska fornspråket sanskrit, medan urdu föredrar arabiska och persiska ord. Engelskans inflytande har sedan kolonialtiden varit massivt: i dagens hindi (och urdu) förekommer det ymnigt såväl gamla och inarbetade lånord som tillfälliga anglicismer.

Hindi talas mest i det s k hindibältet i Nordindien, men det är svårt att säga var hindi slutar och närbesläktade men distinkta språk börjar. I en del delstater främjas nu regionala dialekter som självständiga standardspråk; i en del andra har hindi bibehållit sin starka ställning p g a det lokala språkets starka dialektsplittring eller bristande skriftliga traditioner.

Substantiv har tre genus och tre kasusformer: nominativ, oblik kasusform (”icke-nominativ”) och vokativ (tilltalsform). Postpositioner som följer den oblika kasusformen håller dock på att utveckla sig till de facto kasusändelser.

Verbmorfologin är rätt komplicerad: man skiljer på tre aspekter (avslutad, frekventativ och pågående) och fem kombinerade tempus- och modusformer. Verbböjningen är dock trots sin formrikedom relativt regelbunden, eftersom verbformerna i hindi utvecklat sig från vad som i sanskrit var kombinationer av participformer och hjälpverb.

Hindustani är vad hindi och urdu kallas när de räknas som ett enda språk. Bägge standardspråken utgår från khariboli-dialekten, som av gammalt talats på landsbygden kring Delhi. Den kharibolibaserade standardiseringen är av förhållandevis nytt datum: före artonhundratalet var den stligare brajbhasha- och den östligare awadhidialekten viktigare litteraturspråk i vad som nu är hindibältet. I dag uppfattas de som lantliga eller provinsiella dialekter, låt vara att den äldre brajbhashadiktningen fortfarande uppskattas i religiösa kretsar.

Det pågår inga officiella eller systematiska ansträngningar för att främja en neutral variant av skriftspråket som kunde förena de hindi- och urdutalande. Däremot är användning av latinskt alfabet och neutrala, både för hinduer och muslimer förståeliga former av hindustani vanligt inom den indiska film- och underhållningsindustrin.

Hiri motu eller polismotu är en förenklad, pidginiserad form av det malajisk-polynesiska språket motu. Hiri motu har uppstått som kontaktspråk mellan de olika stammarna i Papua redan före kolonialtiden, men senare nådde detta språk enorm spridning genom Kungliga Papuanska Poliskåren, som använde hiri motu i kommunikation mellan konstaplar med olika modersmål. Hiri motu är fortfarande ett officiellt språk i Papua-Nya Guinea, men har sedan sjuttiotalet minskat i betydelse gentemot engelskan och tok pisin (pidginengelskan). Motu i egentlig mening talas fortfarande av flera tiotusen människor i och omkring huvudstaden Port Moresby.

Holländska eller nederländska är ett germanskt språk som talas i Nederländerna och norra Belgien, där språket kallas flamländska. Ibland påstås det att flamländskan är ett särskilt språk, men faktum kvarstår att dessa två språk eller dialektgrupper delar samma skriftspråk med mindre variationer.

Holländskan är nära släkt med lågtyskan, dvs de germanska dialekter som av gammalt talats i Nordtyskland och som inte genomgått den högtyska ljudskridningen, och under medeltiden uppfattades de holländska och flamländska målen ännu som (låg)tyska munarter: det engelska ordet Dutch (holländsk, holländska) är av samma ursprung som Deutsch, tysk och duits (i dag det holländska ordet för tysk). Den holländska formläran är något enklare än den tyska: skillnaden mellan feminina och maskulina substantiv är t ex nästintill försvunnen, ungefär som i svenskan.

Lånorden kommer mest från engelskan och franskan, precis som i dagens tyska. Holländskan är rikare på franska lånord än tyskan: typiska gamla och inarbetade lån är krant 'dagstidning' (fr. courant 'löpande, aktuell') och kleur 'färg' (fr. couleur).

Hopi är ett uto-aztekiskt språk som talas på hopireservatet i delstaten Arizona i Förenta Staterna. Hopifolket är ett s k pueblofolk, dvs en av de stammar som av gammalt levat bofasta som jordbrukare och bott i hus av soltorkad lera; de delar seder och en del av det kulturspecifika ordförrådet med andra pueblostammar, även om dessas språk inte är besläktade med hopi.

Uttalet är relativt lätt: hopi är inte ett tonspråk, och någon skillnad på tonande och tonlösa konsonanter iakttas inte. Däremot skiljer hopi på långa och korta vokaler. Reduplikation används gärna för att bilda pluralformer för substantiv; dessutom finns det en dualform.

Det finns en utbredd mytologi om hopi som ett språk utan grammatikaliska uttryck för tid. I verkligheten är hopi både i denna och i andra bemärkelser ett överraskande föga exotiskt språk och relativt lätt att lära sig.

Hän eller han är ett nordathabaskiskt språk som talas av en handfull åldringar i Alaska och Kanada. Hän är närmast släkt med gwich'in.

Ido är det mest kända från esperanto härledda språket; namnet ido betyder ”avkomling” både på esperanto och på ido. Språket har en ännu mindre komplicerad formlära än esperanto och saknar dessutom diakritiska tecken över bokstäver; ordförrådet är mera inriktat på romanska språk och mera naturalistiskt. Ido talas på sin höjd av några hundra entusiaster; tack vare Internet har språket dock igen blivit föremål för ett visst intresse.

Ilocano eller ilokano är ett regionalt viktigt språk i Filippinerna, som talas i Ilocos i den nordvästra delen av ön Luzon. Det är ungefär nio miljoner människor som har ilocano till modersmål, men språket har ingen officiell ställning på riksnivån. Ilocano är det största av de nordfilippinska språken, av vilka de flesta är små minoritetsvarieteter; förutom ilocano är det bara pangasinanskan som har fler än en miljon talare.

Indonesiska språket är en variant av malajiskan och det officiella språket i Indonesien. Som ett malajisk-polynesiskt språk har indonesiskan relativt få böjningselement; däremot är ordbildningssystemet rikt och komplicerat. Indonesiskan skiljer sig från den malaysiska formen av malajiskan ungefär som svenskan från norskan; den mest uppenbara skillnaden är att europeiska lånord i indonesiskan skrivs olika. Ord som i svenskan slutar på -ation har i indonesiskan ändelsen -asi (jfr holländskans -atie, -asie), medan ord på -itet har i indonesiskan snarare latinbaserad form: kualitas 'kvalitet'.

Interlingua är ett konstgjort språk som utgår från de romanska språkens gemensamma ordförråd men ger det en återlatiniserad rättskrivning. Det är sålunda ett s k ”neolatinskt” språk. Vid behov används även tyska och ryska ord. Grammatiken är förenklad och regelbunden, som vanligt i internationella hjälpspråk – interlingua saknar t ex genusskillnader, trots att dessa existerar både i latinet och de moderna romanska språken.

Interlingua utvecklades och introducerades i slutet av 1940-talet av den franske språkvetaren André Martinet; projektet sponsrades av organisationen International Auxiliary Language Association (IALA), som redan på 1920-talet grundats av den amerikanska arvtagerskan Alice Vanderbilt Morris. Det fanns redan ett tidigare språkprojekt kallat interlingua, men mera känt som latino sine flexione, utvecklat av den italienske matematikern Giuseppe Peano. Som namnet (”latin utan böjning”) ger vid handen, var även Peanos språk latinbaserat.

Martinets interlingua är ett av de mest framgångsrika internationella hjälpspråken: flera vetenskapliga tidskrifter är villiga att trycka artiklar på interlingua. Det är förmodligen bara esperanto som överträffar interlingua i popularitet.

Interlingue är inte samma språk som interlingua, utan ett tidigare projekt, startat under namnet occidental av Edgar de Wahl, en lärare av estlandstysk bakgrund, år 1922. Språket väckte en del intresse på sin tid, men kritiserades för att vara alltför fokuserat på europeiska språk som förebilder. De Wahl avled ett par år efter andra världskriget, och hans språk dog i stort sett ut därefter. Hans språk var framför allt ett neolatinskt projekt, inte alltför olikt Martinets interlingua.

Inuktut är den samlande beteckningen för de dialekter av den inuitiska grenen i den eskimåisk-aleutiska språkfamiljen som talas i Nunavut i Kanada. Det finns markanta dialektskillnader mellan olika former av inuktut; det vanliga är att indela dem i inuktitut och inuinnaqtun, men alla språkvetare är inte ense om det här. Som alla eskimåisk-aleutiska språk är inuktitut och inuinnaqtun polysyntetiska språk, vilket också är typiskt för många andra språk i Nya världen. De kan skrivas med latinska bokstäver, men i Kanada förekommer även den s k kanadensiska stavelseskriften.

Iriska – Iriska eller irländsk gaeliska är det traditionella folkspråket på Irland, som sedan den stora hungersnöden på 1800-talet gått tillbaka och förlorat terräng till engelskan. Det är ett keltiskt språk som hör hemma i den goideliska eller gaeliska grenen av de ökeltiska språken. Ljudhistoriskt är det ett Q-keltiskt språk, vilket betyder att det ursprungliga keltiska [kw]-ljudet förblev ett [k]-liknande ljud. Iriskans närmaste släktingar är skotsk gaeliska (höglandsskotska) och manx (på ön Man mellan Irland och Skottland), som historiskt sett är iriska dialekter.

Keltiska stammar bosatte sig på Irland på förkristen tid, men de första språkliga minnesmärkena på ett språk som liknar iriska uppstod först på fjärde århundradet e Kr. Det var de s k oghamstenarna, en sorts bautastenar eller kantiga obelisker resta till fallna stormäns minne. Den skrift som läses på dessa stenar heter på nyiriska ogham: den höggs i de vertikala kanterna på stenen. Någon särskilt gammal och urkeltisk uppfinning var oghamskriften nog inte, snarare var det ett morseliknande system att koda latinska bokstäver med.

På sjuhundratalet e Kr började munkarna skriva på den språkform som kallas forniriska, men som redan var mindre arkaisk än språket på oghamstenarna. Det var på detta språk som de äldsta versionerna av de irländska myterna om hjälten Cú Chulainn nedtecknades. Efter två århundraden började den forniriska normen vackla, och medeliriskan kom till – det anses i allmänhet ha varit ett mindre viktigt skede i iriska språkets utveckling vad gäller litteraturen.

Klassisk iriska, eller klassisk nyiriska, skrevs ungefär från 1100 till 1600. Därefter förtvinade den skriftspråkliga traditionen när den överklass som dittills sponsrat hov- och hyllningspoeter slogs i spillror eller gav sig i landsflykt och den brittiska övermakten införde engelskan som enda skriftspråket på Irland. Klassisk nyiriska var kulturspråket även för de gaelisktalande i Skottland och på ön Man, och det är först efter 1600-talet som särskilda skottlandsgaeliska och mangaeliska skriftspråk uppstått.

Den iriska som i dag talas och skrivs på Irland har utvecklat sig från den klassiska nyiriskan, men dialektsplittringen har försvårat standardiseringen avsevärt. De tre huvuddialekterna är Ulsteririskan (i grevskapet Donegal/Dún na nGall), Connachtiriskan (i grevskapen Mayo/Maigh Eo och Galway/Gaillimh) och Munsteririskan (i grevskapen Kerry/Ciarraí, Cork/Corcaigh och Waterford/Port Láirge). Det var ursprungligen Munsterdialekten som användes som standardspråk för hela Irland; på senare tid har Connacht- och Ulsterdialekterna vunnit mer inflytande på skriftspråket.

Iriska språket, som de andra moderna keltiska språken i allmänhet, kännetecknas av ett intrikat system mutationer, dvs växlingar av initialkonsonanter som beror både på det föregående ordet och själva ordets grammatikaliska form: fear 'en man', an fear 'mannen' (maskulint substantiv), bean 'en kvinna', an bhean 'kvinnan' (feminint substantiv), jfr också verbpartiklarna: tagann sé abhaile gach uile lá 'han brukar komma hem varje dag', an dtagann sé abhaile gach uile lá? 'brukar han komma hem varje dag?', nach dtagann sé abhaile gach uile lá? 'brukar han inte komma hem varje dag?'. Dialektskillnaderna syns inte sällan i mutationerna: ag an mbean, ag an bhfear 'hos kvinnan, hos mannen' (i Connacht- och Munsterdialekterna), ag an bhean, ag an fhear (i Ulsterdialekterna).

Isländska – Isländska talas av ungefär trehundratusen människor på Island. Språket är av skandinaviskt (nordgermanskt) ursprung och har utvecklat sig från fornnordiskan, främst de dialekter som talades i Norge när öriket koloniserades. I jämförelse med de kontinentalskandinaviska språken är isländskan dock mycket arkaisk och har för det mesta bibehållit det gamla böjningssystemet: språket har tre genus, fyra kasusformer (nominativ, ackusativ, dativ, genitiv) som alla är levande även i talspråket, och likaså har verben fortfarande personändelser. Starka verb har olika avljudsstadier i ental och flertal i dåtidsformerna: ég hnaut, við hnutum 'jag snubblade, vi snubblade'. Många skandinaviska ord som i de kontinentala nordiska språken har undanträngts eller marginaliserats av lågtyska motsvarigheter är fortfarande levande isländska: eitur 'gift' (jfr sv. etter) , hreiður 'fågelbo' (jfr no. reir), rannsaka 'forska (vetenskapligt)'. Å andra sidan har isländskan och tyskan i gemen en del germanskt arvegods som försvunnit i de andra nordiska språken: nema 'ta; studera', jfr. ty. nehmen 'ta'.

Isländskan undviker lånord och föredrar härledningar och sammansatta ord uppbyggda av inhemska element: stærðfræði 'matematik', tölva 'dator', segulmagna 'magnetisera', Veraldarvefurinn 'webben, WWW', beinir 'router', stafrænn 'digital'. Det finns dock gränser även för isländsk språkrensning: namn på politiska grupperingar och deras medlemmar uppfattas i viss mån som egennamn och tenderar sålunda att komma in i språket som lånord: kommúnisti, sósíalisti, fasisti, nasisti, repúblikani, demókrati (de två sistnämnda om amerikanska förhållanden, demókrati även t ex om kristdemokrater i Tyskland, men lýðveldissinni och lýðræðissinni används om republikaner och demokrater i egentlig mening; jfr även jafnaðarstefna 'socialdemokrati', félagshyggja 'socialism', stjórnleysisstefna 'anarkism', sameignarstefna 'kommunism'), pírati 'pirat' (om piratpartier och piratrörelsen, men sjóræningi i betydelsen 'sjörövare'). Det förekommer att utländska ändelser används för att härleda egna förment internationella ord ur inlånade ordstammar, så t ex dópisti ’knarkare’ från dóp ’knark, tjack’ (skriftspråkligt eiturlyf, egentligen ’giftig medicin’, eller fíkniefni, som betyder ’beroendeämne’, dvs beroendeframkallande), kratismi 'socialdemokrati, sossevälde' (krati 'sosse').

Av naturliga skäl använder givetvis kreativa författare utländska lånord för att stilisera språket. Kända exempel är t ex Magnea Matthíasdóttirs realistiska återgivning av knarkarslangen i romanen Hægara pælt en kýlt eller de historiskt motiverade danska lånorden i Halldór Kiljan Laxness' roman Íslandsklukkan.

Engelska och danska låneord är frekventa i slarvigt vardagstal som resultat av muntliga kontakter med dessa språk, jfr gæi 'grabb, kille' (< guy), sexí 'sexig' (< sexy), bissnes 'affärer' (< business) – men det finns vanligen rena isländska motsvarigheter till dessa ord, här t ex náungi, kyntöfrandi/kynþokkafullur, viðskipti. Låneord används också gärna som efterled i sammansättningar med metaforisk eller föraktfull betydelse, jfr heimspeki 'filosofi' men eldhúsfílósófía 'köksfilosofi, onödigt filosoferande'. Märk också att homosexuella på isländska i dag helst kallas hommi och lespía, eftersom det gamla puristiska uttrycket kynvillingur hade nedsättande innebörd (kyn ’kön’, -villingur från villa ’fel’, dvs ungefär ’sexuell avvikare, pervers’) - det mindre kontroversiella, men långa och tungrodda nyordet samkynhneigð ’böjelse (hneigð, jfr tyska Neigung) till samma kön’ används i skriftspråket. Ibland bildar islänningar puristiska nyord som på ett folketymologiskt sätt liknar det främmande ordet: sålunda kallas teknik tækni (från tæki ’apparat’ med härledningssuffixet -ni som bildar abstrakta feminina substantiv) och ett av de isländska orden för immunbristsjukdomen aids, eyðni, får en att tänka på verbet eyða ’förstöra, utplåna’ men liknar samtidigt det engelska ordet.

Italienska – Italienska språket är ett romanskt språk som talas i Italien och Schweiz; det finns också en världsomfattande italiensk diaspora, som ännu håller fast vid sitt språk bl a i Argentina och i Förenta Staterna. Italienskan kan knappast kallas ett världsspråk, men är ändå ett av de ledande kulturspråken i västvärlden.

Standarditalienskan har utvecklat sig från den språkform som skrevs av trettonhundratalets stora klassiker: Francesco Petrarca, Giovanni Boccaccio och Dante Alighieri. Detta skriftspråk var baserat på den dialekt som då talades i Toscana, särskilt i Florens. Det var dock ingalunda förståeligt för alla som bodde på Apenninska halvön: regionala dialekter – i praktiken ofta självständiga språk – och accenter har alltid varit starka i Italien, och det var först på artonhundratalet som de många småstaterna på halvön – Bägge Sicilierna, Kyrkostaten, Piemonte, Lombardiet osv – förenades till ett enda kungarike.

Den moderna italienska litteraturen började med Alessandro Manzonis historiska kärleksroman De trolovade, på originalspråket I promessi sposi. Manzoni var hemma från Milano i Lombardiet, men samtidigt var han en ivrig förespråkare för det toscanskbaserade skriftspråket. Hans roman, som kom ut år 1827, blev mycket populär och bidrog sålunda till att etablera och konsolidera det italienska litteraturspråket.

Det är dock först etermedierna – radion och teven – som gjort alla italienare förtrogna med standardiserad italienska. Det är alltjämt en stor skillnad på hur standardspråket uttalas i olika delar av landet, och i Norditalien åtnjuter regionala språkformer fortfarande stor uppskattning och status i samhället.

Den italienska fonologin är typiskt romansk bl a i att det är skillnad på öppet och slutet e och o. Det är möjligt att beteckna betonad stavelse med ett accenttecken och använda grav accent för öppen vokal (è, ò), akut för sluten (é, ó), men detta sker inte alls konsistent, och i praktiken är utlänningen tvungen att lära sig utantill vilka ord som har öppen, vilka som har sluten vokal. Grav accent används som betoningstecken för andra vokaler än e och o. Det är vanligt att ersätta betoningstecknet för sista vokalen med apostrof, t ex possibilita’ i stället för possibilità.

Ett särskilt italienskt drag är dubbla konsonanter som resultat av assimilationer: sålunda motsvaras t ex det latinska ordet administratio av amministrazione.

Substantiv indelas i maskulina och feminina; den vanliga pluraländelsen är -i för maskulina (som typiskt slutar på -o), -e för feminina (som givetvis oftast slutar på -a). Substantiv som slutar på en betonad vokal har dock ingen pluraländelse, utan pluralformen kan endast indikeras med hjälp av artiklar och adjektivformer.

Språket har under tidigare sekler införlivat många franska ord; i dagens italienska är engelska lånord (t ex privacy, agency, serial killer osv.) påfallande vanliga.

Jakutiskan eller sacha är ett turkspråk som talas i den autonoma republiken Jakutien i Ryssland. Den utmärker sig med en del egendomliga ljudutvecklingar och morfologiska nydaningar, främst nya kasusformer, samt har tagit upp en hel del influenser från mongoliska och tungusiska språkformer. En betydande del av ordförrådet kan inte förklaras etymologiskt och torde ha kommit in från utdöda paleosibiriska språk. Av naturliga skäl är även ryska lånord vanliga. Å andra sidan saknar jakutiskan de arabiska och persiska ord som lånats in i de flesta turkspråk, eftersom jakuterna inte är muslimer.

Japanskan är det allmänt talade språket i Japan och det viktigaste av de så kallade japoniska språken, av vilka resten talas av små grupper på Ryukyuöarna. Ryukyuspråken är såtillvida olika både japanskan och varandra att de ur rent språkvetenskaplig synpunkt snarare är självständiga språk, men i sitt samhälleliga sammanhang uppfattas de av de flesta som dialekter. De egentliga japanska dialekterna indelas i två huvudgrupper, den västliga och den östliga.

Japanskan (inklusive ryukyuspråken) är veterligen inte besläktad med något annat språk; hypotesen om en s k altaisk språkfamilj, som skulle innefatta japanskan, koreanskan, de tungusiska språken, turkspråken och mongoliskan, är alltjämt omstridd, och det finns knappast två språkvetare som är eniga om vilka språk som ingår i denna familj. Att japanskan vore släkt med koreanskan förefaller mest sannolikt, men betvivlas fortfarande av många lingvister. En möjlig förklaring för de likheter mellan japanskan och koreanskan som finns är att bägge språken i ett tidigt utvecklingsskede tagit emot influenser från samma sedan dess utdöda fornspråk i regionen.

Japanska har skrivits med kinesiska tecken sedan 700-talet, men det är svårt att säga när den japanska skrifttraditionen egentligen börjar, eftersom det inte alltid är klart om ett skriftligt minnesmärke är bristfälligt inlärd klassisk kinesiska eller om det var meningen att den skenbart kinesiska texten skulle läsas högt på japanska. Genuint japansk litteratur blomstrade under Heiantiden (794-1185), då det skrevs långa episka berättelser, s k monogatari, en sorts romaner.

Det moderna japanska språket började utvecklas på 1600-talet, då standardspråket blev Edojapanskan (dvs Tokyojapanskan) i st f den tidigare ledande Kyotodialekten. Sedan 1800-talet har japanerna, som aldrig varit särskilt intresserade av att bekämpa främmande språkliga influenser, släppt in stora mängder västerländska lånord, särskilt engelska, men på vissa gebit även tyska. Det största långivarspråket har dock varit kinesiskan tack vare sin enorma kulturella prestige i hela regionen.

Fonologiskt utmärker sig japanskan med rena vokaler, och den saknar i princip sådana konsonantanhopningar som svenskans skr i ordet skratta. Grammatiken är agglutinerande, dvs baserad på böjningsändelser, och sålunda mycket olik den kinesiska. Någon tonalitet i kinesisk mening finns inte i japanskan, men tonhöjdsaccenten spelar en roll som liknar den exspiratoriska accentens i europeiska språk; tonhöjdssystem varierar dock mellan olika japanska dialekter. Den japanska skriften kombinerar kinesiska tecken (på japanska kallade kanji) med två olika stavelseskrifter (katakana och hiragana), även dessa av kinesiskt ursprung till att börja med. Katakana används till att skriva västerländska lån, medan hiraganabokstäverna är reserverade för rent japanska element, t ex böjningsändelser.

Jiddisch är ett germanskt språk som före andra världskriget talades av judar i Polen, Ukraina, Vitryssland och andra östeuropeiska länder och regioner. I dag är det dock bara små diasporasamhällen och grupper av kulturaktivister som ännu håller fast vid jiddisch. Dessutom föredrar vissa strängt ortodoxa judiska grupper i Israel jiddisch framför hebreiska som vardagligt talspråk: för dem är hebreiskan endast ett heligt, religiöst språk.

Jiddisch är i princip tyska med massor av hebreiska och slaviska lånord. Alfabetet är det hebreiska, men vissa bokstäver som inte är relevanta för ljudsystemet i jiddisch används till att skriva vokaler. Hebreiska lånord skrivs dock som i hebreiskan, med undantag av den i Sovjetunionen gängse rättskrivningen, som föredrog att stava även dessa ljudenligt.

Det tyska elementet i jiddisch har inte helt samma dialektunderlag som högtyskan, varför till exempel ordet etwas 'något' motsvaras i jiddisch av eppes (jfr det luxemburgiska ordet ebbes). Uttalet har påverkats av slaviska språk.

Jukagiriska är namnet på två besläktade, men sinsemellan oförståeliga språkformer som tillsammans utgör det enda som återstår av den jukagiriska språkfamiljen. Antagligen har det tidigare funnits ett kontinuum jukagiriska dialekter mellan dessa två. Jukagiriska språk har förr i världen talats i ett relativt stort område i nordöstra Sibirien, men håller på att dö ut. Det har spekulerats om att de kunde vara släkt med finsk-ugriska språk, mest på grund av den typologiska likheten. De jukagiriska språken, tundrajukagiriskan eller wadul och skogsjukagiriskan eller odul, talas vid skrivande stund av färre än hundra människor.

De jukagiriska språken utgör en av de s k paleosibiriska språkfamiljerna. Det är en samlande areal beteckning för de språk som talades i Sibirien innan turkspråk, tungusiska språk och senare ryskan började göra sig gällande.

Kannada – Kannada är ett dravidaspråk som talas i den indiska delstaten Karnataka och skrivs med ett eget alfabet icke alltför olikt telugus. Kannada har gamla anor som kulturspråk, och sanskrit har influerat både språket och dess grammatiktradition. I dag spelar kannada även en viktig roll som modernt litteraturspråk.

Som dravidaspråk i allmänhet är kannada ett agglutinerande språk med ett intrikat system av böjningsändelser. Substantiv har tre genusformer och böjs i sju kasusformer. Verbböjningen är likaså rik och komplicerad.

Karelska i egentlig mening avser det östersjöfinska språk som talas i den autonoma republiken Karelen i Ryssland. Karelska språket talas av några tiotusen, kanske t o m ett hundratusen människor, men det är knappast ett enda språk vad gäller förståeligheten: de tre stora dialektgrupperna är egentlig karelska (fi. varsinaiskarjala, ry. sobstvenno karel'skij), som ligger närmast finskan, olonetskarelska (fi. aunuksenkarjala, ry. livvikovskij) och lydiska (fi. lyydi, ry. ljudikovskij), som egentligen utgår en övergångsdialekt mellan karelskan och vepsiskan. Därför har försöken att utarbeta ett gemensamt skriftspråk för alla karelska dialekter runnit ut i sanden.

För den som utifrån finskan försöker förstå karelska dialekter är det de ryska lånorden som är den största svårigheten, men man bör inte intala sig att karelska bara är finska uppblandad med ryska. De finnar som är bevandrade i sitt nationalepos, Kalevala, förstår karelska bättre, ty när allt kommer omkring är det från Karelen som största delen av materialet härstammar, och trots att den slutliga redaktionen av Kalevala obestridligen är finska förekommer det en hel del karelska egenheter i texten, som den s k reflexiva verbböjningen: ”tvätta sig” heter peseytyä på modern finska, ”tvättar sig” peseytyy, ”tvättade sig” peseytyi, men i Kalevalaspråket pesekse ”tvättar sig”, pesihe ”tvättade sig”.

Karelska har under nittonhundratalet skrivits både med latinska och med kyrilliska bokstäver, vilket inte heller underlättat standardiseringen av språket. En stor del av det skriftliga material som producerats under sovjettiden är dessutom så förryskat att det i praktiken bara är ryska ord med karelska ändelser. Å andra sidan har sovjetstaten under en viss period utgått från att utbilda karelsktalande urinvånare till att använda finska som skriftspråk för att ha tillgång till politisk pålitliga partikadrer med goda kunskaper i finska språket i den händelse man skulle lyckas med att ockupera Finland och införa det sovjetiska statsskicket i landet.

De folkmål som talas i landskapet Norra Karelen i Finland är inte karelska, utan finska och ingår i de savolaxiska dialekterna, trots att de ofta felaktigt omtalas som karelska eller nordkarelska. I Finland är det bara i Ilomants (fi. Ilomantsi, kar. Il'manči) som man ännu kan höra genuin karelska.

Kashmiri talas av drygt fem miljoner människor, mest i den indiska delstaten Jammu och Kashmir. Det ingår i de dardiska språken, som är en relativt litet utforskad gren av de indoeuropeiska språken. Kashmiri skrivs både med devanagari och med en variant av det arabiska alfabetet, och förutom olika skriftsystem har kashmiritalande hinduer och muslimer också något olika ordförråd.

Kasjubiska talas av ett hundratusental människor på landet kring staden Gdańsk i norra Polen. Det är ett västslaviskt språk nära besläktat med polskan; ofta anses det vara en dialekt av polskan. Formläran och uttalet skiljer sig fortfarande markant från polskans, medan ordförrådet tagit emot massiva polska influenser.

Kataba eller catawba är ett utdött nordamerikanskt indianspråk och den enda någorlunda väldokumenterade representanten för de sydliga siouxspråken. (Det andra sydliga siouxspråk man känner till, woccon, existerar bara i form av en kort ordlista.) Katabaindianerna eller iswa existerar fortfarande som etnisk grupp och försöker återuppliva språket.

Det förefaller att den sista människan med kataba som modersmål var Samuel Taylor Blue, som dog år 1959. Red Thunder Cloud, som dog år 1996 och påstod sig vara kataba, anses numera varken ha varit av amerikanskt infödingsursprung eller ha talat kataba som modersmål.

Katalanska – Katalanskan är ett romanskt språk som talas i de katalanska landen, els països catalans, dvs Katalonien, Valenciaprovinsen och ögruppen Balearerna (Mallorca, Menorca, Ibiza – på katalanska Eivissa – och Formentera). Dessutom finns det ett gammalt katalansktalande samhälle i staden Alghero på Sardinien.

Katalanska språket är inte en spansk dialekt, utan ett självständigt romanskt språk. I det centrala ordförrådet finns det en del gemensamt med franskan: så heter t ex 'hitta' trobar (fr trouver, sp encontrar), 'långt borta' lluny (fr loin, sp lejos), 'äta' menjar (fr manger, sp comer – det franska och katalanska verbet har utvecklat sig från latinets manducare 'tugga, idissla', det spanska från det klassiska latinets edere 'äta' med ett härledningsprefix). Adverbet gaire i nekande uttryck som t ex no és gaire lluny 'det är inte mycket långt borta' har en direkt motsvarighet i franskan (guère) men inte i spanskan. Obetonade vokaler reduceras i katalanskt uttal, vilket inte är typiskt för spanskan. Nasala vokaler, som är så utmärkande för franskan, saknas å andra sidan i katalanskan.

Unikt katalansk är den analytiska perfektform som består av verbet anar 'gå' i presens som hjälpverb och det egentliga verbets infinitiv: vaig menjar 'jag har ätit'. En spansktalande missuppfattar detta som futurum (jfr spanska voy a comer 'jag ska äta').

På grund av den ökande regionaliseringen i Spanien har det förekommit tendenser att definiera ett särskilt standardspråk, valencià eller valencianskan, för Valenciaprovinsen. Detta gillas dock av långt ifrån alla valencianer, och många författare föredrar att använda samma språknorm som i Katalonien, eventuellt berikad med egna dialektala element.

Kerek är ett relativt nyligen utdött språk, som talades av renskötande nomader i ryska Fjärran Östern; språket ingår i den tjuktjiska grenen av den tjuktji-kamtjatkanska språkfamiljen och är sålunda nära släkt med korjakiskan och tjuktjiskan.

Keres är ett isolerat språk som talas av ungefär tiotusen människor i ett antal pueblosamhällen i New Mexico. Varje pueblo har sin egen dialekt, och skillnaderna är så stora att en del forskare anser att keres inte är ett språk utan två. Keres liknar typologiskt de andra språken i samma kulturområde trots att något släktskap inte finns. Keres skiljer på långa och korta vokaler; dessutom förekommer viskade vokaler, men det är svårt att säga om de är självständiga fonem. Keres är ett tonspråk.

Keres var länge ett oskrivet språk, och även i dag anser många kerestalande att det av kulturella och religiösa skäl inte är tillåtet att skriva på keres. Ändå har det utarbetats skriftsystem för ett par keresdialekter. Keres är ett verbcentrerat språk, som mest använder prefix (förstavelser) i böjningsformerna. Lånord från spanska är vanliga och ofta väl inarbetade.

Ketiska – Ketiska språket, ett sibiriskt minoritetsspråk i Ryssland, hör hemma i den jenisejiska språkfamiljen och är det sista av de jenisejiska språken som vid skrivande stund ännu talas – en handfull besläktade språk, främst den nyligen utdöda, närbesläktade jugiskan, har beskrivits eller belagts i varierande omfattning, tidigare försvunna jenisejiska språk var kottiska och assaniska. Ketiskan är ett tonspråk som utmärker sig med en agglutinerande formlära rik på suffix, prefix och även infix (böjnings- och härledningselement som sätts in i en ordstam). Det har funnits många teorier och hypoteser om ett släktskap mellan de jenisejiska språken och någon annan språkfamilj, senast med na-denespråken i Nordamerika. Medan den sistnämnda teorin fortfarande är omstridd, bör det konstateras att ketiskan åtminstone typologiskt liknar de nordamerikanska språken.

Khmer eller kambodjanska talas i Kambodja, där det är majoritetsspråket och har officiell ställning. Khmer är ett austroasiatiskt språk och sålunda släkt bl a med vietnamesiskan och mon – de austroasiatiska språken kallas faktiskt fortfarande ibland för mon-khmerspråk. Khmer har äldre anor som skrift- och kulturspråk än något annat austroasiatiskt språk och talas av sexton miljoner människor, de flesta i Kambodja, men även i grannländerna, där det finns stora khmertalande minoriteter. Språket skrivs med en egen stavelseskrift av indiskt ursprung.

Khmer avviker från de flesta språken i regionen i att det inte är ett tonspråk. Däremot är det nog ett isolerande språk, åtminstone i dag – skriftspråket har fortfarande vissa härledningsprefix och suffix som dock inte längre är produktiva i talspråket. Dessa vittnar om att khmer tidigare haft en mera agglutinerande struktur.

Khmer har tagit emot enorma influenser från hinduismens och buddhismens heliga språk, dvs sanskrit och pali. Dessutom har de koloniala översittarspråken franskan och thailändskan lämnat sina bidrag, låt vara att deras inflytande bekämpas av den kambodjanska språkvården. Å andra sidan har khmer också lämnat sina spår i grannspråken.

Khowar är ett dardiskt språk som mest talas i regionen Chitral i nordvästra Pakistan. De dardiska språken är en relativt litet utforskad gren i den indoeuropeiska språkfamiljen; det viktigaste av dem är kashmiri. Det sägs att språket bara talas av ett par hundratusen människor som modersmål, men den här siffran är vilseledande låg, eftersom khowar faktiskt är ett regionalt viktigt språk som många med ett annat modersmål behärskar. Khowar skrivs med den pakistanska varianten av de persisk-arabiska bokstäverna, men har ingen imponerande skriftlig tradition, och de flesta khowartalande föredrar något större språk, främst urdu, för skriftliga ändamål.

Kinesiska – Kinesiska språk utgör egentligen en hel gren i den sinotibetanska språkfamiljen, men av historiska, kulturella och politiska skäl räknas de som ett enda språk. Kinesiskan är ett av världens stora kulturspråk som haft inflytande långt utöver Kinas gränser, och kinesisk kultur har länge väckt intresse och entusiasm även i västerlandet. Kinesiskan är ett tonspråk, dvs musikalisk accent spelar en viktig roll i att skilja på annars identiska ord.

Den klassiska kinesiskan härrör från 500-200-talen f Kr, men det finns även tidigare språkliga minnesmärken, främst de så kallade orakelbenen. Det klassiska språket har använts till skriftliga ändamål ända fram till tjugohundratalet, då det nuvarande standardspråket fått officiell ställning. Den viktigaste skillnaden mellan klassisk och modern kinesiska är att det klassiska språket insisterar på enstavighet medan talspråket – särskilt det mandarinkinesiska, som har färre toner än många andra kinesiska dialekter – oftast föredrar förtydligande sammansättningar på två stavelser. Den klassiska kinesiskan användes förr i tiden som ett kulturspråk även i Japan, Korea och Vietnam och bidrog med massor av lånord till de lokala språken i dessa länder.

Det skriftspråk som används i dagens Kina har utvecklats från de nordliga dialekterna: både standardspråket och dialekterna kallas gärna för mandarinkinesiska, även om folkmålen givetvis avviker både från varandra och från skriftspråket. Det var faktiskt genom etniskt främmande erövrardynastier norrifrån (tunguser, manchuer, mongoler) som denna dialekt fick en så viktig ställning i Kina.

De facto standardspråket för mandarinkinesiskan var länge dialekten i Nanjing. Det är först sedan artonhundratalet som beijingmålet kört om nanjingdialekten, och det är precis därför vi i dag skriver Bei-jing och Nan-jing (och Tian-jin) i stället för det äldre Pe-king respektive Nan-king (men Tien-tsin), som återspeglar nanjinguttalet. Mandarinkinesiska dialekter är numerärt överlägsna alla andra kinesiska språk eller dialekter: även i de asiatiska länder där den lokala kinesiska minoriteten traditionellt talat någon annan språkform är det nu vanligen standardiserad mandarinkinesiska som lärs ut i skolor.

Den utomlands mest kända icke-mandarinska dialekten är yue eller dess mest utbredda och uppskattade form kantonesiskan. Kanton är det västerländska namnet på både den sydostkinesiska provinsen Guangdong och dess huvudstad Guangzhou, och det är främst i denna provins som man av gammalt talat kantonesiska. De före detta kolonierna och nuvarande särskilda administrativa regionerna Macao och Hong Kong ligger geografiskt sett i denna provins, vilket innebär att kantonesiskan är ett utbrett talspråk i dem, låt vara att den officiella mandarinkinesiskan också där har en allt starkare ställning. Att de här viktiga handelshamnarna är belägna precis i Guangdong har underlättat utvandring från provinsen, och det är därför kantonesiska talas mycket i kinesiska invandrarsamhällen t ex i Förenta Staterna.

De västerländska namnen på de kinesiska statsmännen Chiang Kai-shek och Sun Yat-sen är kantonesiskbaserade; de mandarinkinesiska formerna av samma namn, latiniserade enligt det i dagens Kina gällande pinyinschemat, lyder Jiang Jieshi och Sun Yixian. Vanligen omtalas dock Sun Yat-sen på mandarinkinesiska som Sun Zhongshan, som är en kinesisk översättning eller återgivning av hans japanska täcknamn Nakayama Sho.

Mindialekter talas bl a i Hainan, Taiwan och provinsen Fujian. Mindialekterna är dock brokiga och oenhetliga, inte ens förståeliga sinsemellan. Den viktigaste undergruppen torde vara min nan eller södra min. Den här dialekten talas bl a av den kinesiska minoriteten i Kambodja, som i engelskspråkiga sammanhang gärna kallar sig teochewkineser. Teochew är en rättskrivningsvariant av namnet på Chaozhou, en stad i östra Guangdong (Chaoshanregionen), där en särskild varietet av min nan av gammalt har varit förhärskande. Haing S. Ngor, författaren till den välkända boken om Pol Pots grymheter i Kambodja, Liv på dödens fält, talade teochewkinesiska som modersmål.

Wudialekter talas bl a i Shanghai, och därför är det vanligt att kalla dem shanghajiska, men det är egentligen staden Suzhou som traditionellt ansetts vara den kulturellt och språkligt ledande i wuområdet. Wudialekter är också mycket diverse.

Hakka- eller kejiaspråket är historiskt sett en nordkinesisk språkform, men talas i dag uteslutande i södra Kina. Hakkafolket anses ha lämnat sin ursprungliga hemtrakt i Nordkina ungefär på 300-talet e Kr, och dess dialekt är en av de varieteter som talades i området innan mandarinkinesiska dialekter bredde ut sig på den nordkinesiska slätten. Hakkatalande samhällen är utspridda över stora områden i Sydkina, och dialekterna är sålunda många och oenhetliga. Hakkafolket har många kulturella särdrag och har kanske starkaste anspråk av alla dialektgrupper i Kina på att utgöra en egen etnicitet. Taipingupproret var i första hand ett hakkauppror.

Ett specialfall är dungandialekten. Det är en mandarindialekt som talas av några tiotusen människor i Kirgizistan och Kazakstan och har eget skriftspråk baserat på kyrilliska bokstäver. Dunganspråket liknar mest dialekterna i den kinesiska regionen Gansu men har tagit upp många lånord från ryskan och lokala turkspråk. Dunganfolket är muslimer, kulturellt och språkligt nära besläktade med de likaså muslimska hui-kineserna i Kina. Dessa talar en egen mandarinkinesisk sociolekt.

Kinesiska – både standardspråket och dialekterna – skrivs vanligen med någon variant av det kinesiska skriftsystemet. Det finns många sätt att translitterera kinesiska med latinska bokstäver, av vilka det i Kina officiella pinyinsystemet i dag är förhärskande. Pinyin utvecklades ursprungligen för att återge mandarinkinesiska, men pinyinliknande system har sedan dess utarbetats även för andra kinesiska språkformer. Pinyin känns genast igen på bokstaven q, som används till att återge vad som på ett ungefär är en kombination av [t] och ett rikssvenskt tje-ljud med aspiration.

Mandarinsk standardkinesiska kan också återges med ett system som kallas bopomofo eller zhuyin. Det är en fonetisk skrift baserad på kinesiska tecken, som till skillnad från vanlig kinesisk skrift inte skiljer på ord med olika betydelse men samma uttal. Bopomofo har använts som hjälpreda i undervisning och utbildning, bl a som ett sätt att återge uttalet för svåra eller sällsynta skrifttecken. I dag förekommer bopomofo veterligen bara i Taiwan och lär mest användas till inmatning av data.

Kiowa är ett kiowa-tanoanskt språk som talas av ett hundratal medlemmar av kiowastammen i Oklahoma. I motsats till de andra kiowa-tanoansktalande grupperna var kiowafolket vandrande prärieindianer, varför forskarna länge fann det svårt att klassificera deras språk. I dag är det dock fullkomligt säkert att kiowaspråket är besläktat med de tanoanska språken (tewa, tiwa och towa), som talas av vissa s k puebloindianer i Arizona och New Mexico (”puebloindianerna” är inte en språklig, utan en kulturell gruppering).

Kiowaspråket skiljer på korta och långa, nasala och icke-nasala vokaler. Det är ett tonspråk.

Koreanska är det officiella språket i Nord- och Sydkorea; dessutom finns det ett autonomt område för den koreanska befolkningen i Kina strax norr om Nordkorea. Veterligen är koreanska språket inte besläktat med några andra språk, även om det förekommer försök att inkludera det i den s k altaiska språkfamiljen. Typologiskt liknar koreanskan en hel del japanskan, ty bägge språken är agglutinerande och rika på böjningsändelser. Som japanskan har även koreanskan välkomnat både kinesiska och på senare tider engelska lånord.

Koreanska språket har p g a naturförhållandena på den koreanska halvön alltid varit rikt på dialektskillnader. Dessutom är det tänkbart att en del av de små kungariken som i forntiden existerade på halvön inte var koreansktalande utan hade egna språk och att dialektskillnaderna delvis beror på substratinfluenser från dessa utdöda och odokumenterade, inte nödvändigtvis ens besläktade språk. Vissa likheter mellan koreanskan och japanskan, som förlett språkvetare till att spekulera om ett släktskap mellan dessa två, kan bero på gemensamma influenser från ett sådant fornspråk.

Det finns de som anser att den dialekt som av gammalt talats på den även kulturellt mycket distinkta ön Cheju (Jeju) är tillräckligt avvikande för att räknas som skilt språk. Chejudialekten har dock under 1900-talet drabbats av nedgång och är utrotningshotad; det språk som de flesta chejubor i dag talar är en av den traditionella dialekten påverkad variant av rikskoreanskan.

Koreanskan har eget skrivsystem, ett alfabet som kallas hangul. I motsats till den kinesiska skriften, som också har använts i Korea (enstaka kinesiska tecken används fortfarande ibland i Sydkorea), är hangulskriften uttalsbaserad. Ljudtecknen grupperas dock ihop i stavelseblock, och ett sådant block kan av en oinvigd uppfattas som en enda ”bokstav”. Dagens koreaner är nationalistiskt stolta över sitt inhemska skriftsystem, som de anser vara världens mest praktiska; även om detta inte nödvändigtvis är sant, är det uppenbart att övergången från det kinesiska skriftsystemet till hangulskriften bör ha utgjort ett stort steg framåt för den allmänna läskunnigheten i Korea. Den koreanska skriften motsvarar dock inte helt uttalet, ty i koreanskt talspråk anpassas ljuden till varandra (assimileras) på ett sätt som rättskrivningen inte återspeglar.

Koreanska substantiv böjs i ett halvdussin kasusformer. Verbböjningen är invecklad och inbegriper både tempus-, aspekt- och modusändelser samt hövlighetssuffix. Adjektiv ersätts ofta med s k stativa verb – ”att x-a” i stället för ”att vara x” där x står för ett adjektiv. Relativsatser existerar inte heller i koreanskan: i stället för dem används särskilda verbformer, så att t ex ”mannen som äter kött” uttrycks med ”den köttätande mannen”.

Det koreanska ljudsystemet uppvisar en tredelad distinktion mellan ”svaga”, ”spända” och aspirerade konsonanter. Detta gäller särskilt för klusilerna. De svaga klusilerna i koreanskan återges i vårt latinska alfabet gärna med bokstäverna b, d, g, aspirerade med p, t, k och de spända med dubbla bokstäver pp, tt, kk (bb, dd, gg skulle dock bättre motsvara den koreanska skriften, där de skrivs med fördubblade ”svaga” bokstäver). Hur de svaga och spända konsonanterna exakt skiljer sig från varandra, förbluffar fonetikerna än i dag – de svaga konsonanterna är ingalunda alltid tonande.

Det finns markanta skillnader mellan standardkoreanskan i Nord- och Sydkorea:
  • I Sydkorea är lånord, både kinesiska och engelska, mycket vanligare. De nationalistiska, t o m rasistiska, attityder som utmärker den kommunistiska regimen i Nordkorea tar sig också språkliga uttryck.
  • Likaså föredrar Sydkorea engelska former av utländska ortnamn, medan den nordkoreanska formen vanligen utgår från det lokala språket och uttalet. Sålunda är t ex det nordkoreanska namnet för Polen baserat på det polska (Polska), medan det sydkoreanska är en transkription av det engelska (Poland). Nord- och sydkoreanska återger dessutom de tonlösa klusilerna i långivarspråken på olika sätt: nordkoreanskan transkriberar dem som spända ([pp]ols[kk]a), sydkoreanskan som svaga ([b]olan[d]).
  • Nord- och sydkoreanska standardspråk har lite olika dialektunderlag. Det mest påfallande resultatet av detta är att ett historiskt r i början av ordet i sydkoreanskan antingen blivit j (i engelskpåverkade transkriptioner y) eller n, medan nordkoreanskan fortfarande har r; sålunda skrivs och uttalas t ex ordet för ”arbete” rodong i Nordkorea och nodong i Sydkorea.
  • I Sydkorea används kinesiska tecken fortfarande ibland, medan Nordkorea helt gått in för hangul.

Korjakiska talas av ett par hundra korjaker i ryska Fjärran Östern. Korjakerna är ett renskötande nomadfolk och både kulturellt och språkligt nära släkt med tjuktjierna; språket hör hemma i den tjuktjiska grenen av de tjuktji-kamtjatkanska språken.

Korsikanska språket är nära besläktat med den romanska dialekt som talas i Toscana och som utgör grunden för standarditalienskan. I dag behärskar dock de flesta korsikaner franska bättre, och det är bara en tiondedel av Korsikas befolkning som till vardags talar det traditionella språket. Dialekterna i norra Sardinien, sassariskan och galluriskan, är snarare korsikanska än sardiska, och dessa har i dag fler talare än den egentliga korsikanskan.

Krimtatariska är ett turkspråk som talas av krimtatarerna, ett folkslag som under sovjettiden i sin helhet deporterades österut, som först efter sovjetmaktens kollaps kunde återvända till sin forna hemtrakt och som i dag utsätts för nya förföljelser när Ryssland ockuperat Krim. Det krimtatariska språket är ett turkspråk och inte särskilt nära släkt med den egentliga (volga)tatariskan; av gammalt har även dess interna dialektskillnader varit stora. Förföljelserna i Sovjet har lett till att det krimtatariska språket börjat falla i glömska: i dag är det mest bara äldre krimtatarer som talar sitt nedärvda språk.

Den dialekt av krimtatariskan som utgör grunden för dagens standardspråk representerar den kiptjakiska grenen av turkspråken, men har senare varit föremål för starka influenser från de oghuzturkiska språken (t ex den turkiska som talas i Turkiet). Andra dialekter har dock ursprungligen hört hemma i andra grenar, låt vara att konvergent utveckling senare ökat deras ömsesidiga förståelighet.

Kroatiska är ett sydslaviskt språk som talas i Kroatien och angränsande länder. Det kroatiska skriftspråket är som det serbiska, bosniska och montenegrinska baserat på den dialekt som kallas neosjtokaviska, men i Kroatien har det av gammalt även talats två andra dialekter, tjakaviska och kajkaviska, som är mycket olika sjtokaviskan. Det är särskilt kajkaviskan som ofta omtalas som ett skilt språk.

Den kroatiska varianten av litterär neosjtokaviska utgår från de ijekaviska målen, vilket innebär att den historiska s k jat’-vokalen i standardkroatiska motsvaras av je eller ije. Sålunda heter ’tid, väder’ vrijeme på kroatiska, men vreme på serbiska, och ’sann’ vjeran respektive veran. Det är dock långtifrån alla kroater som skiljer på ije och je i uttalet, och ibland ser man experimentella publikationer där båda stavas ie (vrieme, vieran). En del kroater talar ikaviska mål – där det heter vrime och viran – men denna dialekt har ingen officiell ställning i Kroatien.

Kroatiskan har också enklare verbböjning – de dåtidsformer som alltjämt är levande serbiska eller montenegrinska har för det mesta försvunnit från språkbruket, och den form som mest används liknar de i västslaviska språk övliga, dvs är sammansättningar av den aktiva dåtidsparticipen och en obetonad form av verbet ”att vara”.

Det finns avsevärda skillnader mellan kroatiskan och serbiskan i ordförrådet: lånorden har kommit in skilda vägar och har ofta olika form. Kroatiskan är mindre mottaglig för lånord och föredrar i många fall sina egna nybildningar (t ex nogomet ’fotboll’ i stället för fudbol). Kroatiskan föredrar också slaviska månadsnamn medan serbiskan har latinska (allmäneuropeiska).

Kroatiska skrivs med latinskt alfabet. De kroater som bor i Österrike (de s k burgenlandskroaterna) har eget tjakaviskt skriftspråk som skiljer sig markant från standardkroatiskan men använder samma specialtecken som kroaterna i Kroatien. En sorts kroatiska är också det bunjevska eller bunjevatsiska språket. Det är en ikavisk, starkt ungerskpåverkad dialekt som talas av en liten minoritet i den autonoma provinsen Vojvodina i Serbien. Talarna har eget skriftspråk och egna tidningar.

Kymriska eller walesiska talas av minst en halvmiljon människor, de flesta i Wales, men även av ättlingar till walesiska invandrare i Argentina. Språket är keltiskt och ingår i den brittiska grenen av keltiska språk, vilket innebär att det är närmast släkt med bretonskan och cornwallskan; däremot liknar kymriskan inte alls de gaeliska språken som t ex iriskan, och man måste faktiskt förstå sig på språkvetenskap för att känna igen släktskapet.

Som alla keltiska språk har kymriskan ett komplicerat system av konsonantförändringar, s k mutationer, i början av ord.

Ladinska är ett litet romanskt språk som talas av trettiotusen människor i Dolomiterna i nordöstra Italien. Ofta ser man ladinskan, furlanskan (friuliskan) och de rätoromanska dialekterna i Schweiz som rätoromanska språk i vidare bemärkelse, men det är fortfarande omstritt, om släktskapet mellan de tre språken verkligen är så nära. Dialektskillnaderna är stora, och precis som i Schweiz har det nyligen (på nittiotalet) utarbetade gemensamma skriftspråket inte accepterats av alla ladinsktalande.

LaotiskaLaotiska språket, som har officiell ställning i Laos och där talas av majoriteten, är nära besläktat med thailändskan, och den språkform som talas i den närliggande regionen Isan i Thailand är snarare en laotisk än en thailändsk dialekt. Laotiska skrivs med ett alfabet som liknar det thailändska, men rättskrivningen är mindre historisk än i thailändskan och ligger närmare det verkliga uttalet.

Latin – Latinet är ett av de två klassiska språk som alltjämt präglar den västerländska civilisationen. Språket fick sitt namn av den region på Apenninska halvön som fotbollsentusiaster i dag känner igen som Lazio och som på latin heter Latium. Latinet är ett italiskt språk och hör sålunda hemma i den indoeuropeiska språkfamiljen. De övriga italiska språken dog ut under romarrikets tid: dessa inkluderar faliskiskan, som var närmast släkt med latinet, och de mera avlägsna sabelliska språken som oskiskan och umbriskan.

Det är självklart att latinet redan i antiken tog emot lånegods från flera håll: de viktigaste långivarspråken torde ha varit grekiskan och etruskiskan. Grekisk litteratur studerades av romarna och talades dessutom som modersmål bl a i Sicilien; etruskiskan dog ut som talspråk redan under Roms klassiska tid, men många fornromerska begrepp, seder och vidskepelser förefaller ytterst härstamma från etruskerna, vilket också återspeglas i ordförrådet: ordet person (lat. persona) är veterligen ett etruskiskt ord för teatermask. Keltiska ord upptogs särskilt i vagnmakarnas latin: det svenska ordet kärra har lånats in från latinet, men härstammar från ett keltiskt språk.

Det latin som lärs ut i skolor och på universitet är det klassiska, dvs det som skrevs av uppskattade författare från den romerska republikens sista tid ändå fram till kejsar Augustus' död. Den viktigaste av dessa klassiker är essäisten och vältalaren Marcus Tullius Cicero. Vi vet dock en hel del om det latin som skrevs före Cicero. På förklassiskt latin skrev t ex komediförfattarna Plautus och Terentius och historikern Cato den äldre; dessutom bör vi nämna De tolv tavlornas lag, författningen för den romerska republiken. En mycket svårtydd förklassisk text, som alltjämt vållar de lärde huvudbry, är ritualsången Carmen Saliare.

När latinet under det romerska imperiets tidevarv spreds till nyss erövrade områden, uppstod nya dialekter och varieteter som från början var rätt olika det klassiska språket: befolkningen i de erövrade länderna lärde sig inte latinet genom formell utbildning, utan i dess talade, ”vulgära” form, som redan under den klassiska tiden bör ha varit rätt olik det välpolerade skriftspråket. Ordförrådet i de romanska språken är baserat på talspråket, inte på det klassiska latinet: sålunda har ignis 'eld' fått ge vika för focus 'eldstad' (jfr franska feu, italienska fuoco, spanska fuego 'eld'), och equus 'häst' har avlösts av caballus 'hästkrake, kuse' (fr cheval, it cavallo, sp caballo 'häst'). Likaså är det romanska ordet för 'gammal' (fr vieux, vieille, sp viejo, it vecchio) vanligen baserat på en diminutivform (vetulus, i vulgärlatinet förvanskad till veclus) av det ursprungliga adjektivet vetus (genitiv veteris), som p g a sin oregelbundna böjning föll i glömska i vulgärspråket.

Under medeltiden överlevde latinet som skriftspråk medan de vulgärlatinska språkformerna utvecklade sig till romanska språk. Medeltida latin var mycket olikt det klassiska: det var ett alltigenom kristligt språk genomsyrat med bibliskt ordval och bibliska metaforer, och särskilt ordföljden och satsläran visade påverkan från de allmogespråk och folkmål som författarna hörde talas i sina respektive hemländer. Även uttalet varierade, och det förekom att två latinlärda från olika länder inte kunde konversera på språket p g a fonologiska skillnader. Denna förbistring var en av orsakerna till den återgång till klassiskt latin som karaktäriserade renässansen. Å andra sidan var medeltidslatinet i alla sina variationer ett naturligt talspråk som djäknarna lärde sig vid ung ålder och som utvecklade sin egen folklore (representerad bl a av den samling djäknevisor på latin och medelhögtyska som upptäcktes i början av artonhundratalet på klostret Benediktbeuern i Sydtyskland, Carmina Burana, numera välkänd i Carl Orffs tonsättning). I den bemärkelsen är det motiverat att påstå att medeltidslatinet på sin tid var ett levande språk, även om det inte var någons modersmål.

Under renässansen återupplivades intresset för antika auktorer och deras stil, och medeltidslatinet avfärdades som en förfallen och förvanskad språkform. Det latin som i dag används t ex i Finlands Rundradios latinska nyhetssändningar på språket, är i princip återupplivat klassiskt latin. Även den katolska kyrkan använder i dag en form av latinet som närmast påminner om renässansens, med undantag av uttalet, som alltjämt är medeltida (så att t ex ord som natio, laudatio osv uttalas [na:tsio:], [lauda:tsio:]).

Skollatinet har däremot i de flesta länder övergått till ett rekonstruerat klassiskt uttal, låt vara att det finns skillnader mellan olika uttalsskolor. Vid Helsingfors universitet (och på nyhetssändningen Nuntii Latini) uttalas sålunda både ae och oe som [e:], men på Åbo Akademi har jag lärt mig skilja på ae [ai] och oe [oi], vilket är det äldre klassiska uttalet.

Latinska substantiv har tre genus: maskulin, feminin och neutrum. Latinet har sex kasusformer, dvs nominativ, ackusativ, vokativ, ablativ, ackusativ, dativ och lokativ, av vilka den sistnämnda dock var marginaliserad redan i det klassiska språket. Latinska verb har sex tempusformer som inte är särskilt märkliga eller ovanliga i europeiska språk i allmänhet; en del av dem har i de romanska språken försvunnit och ersatts med sammansatta verbformer. Bestämda och obestämda artiklar förekommer inte i klassiskt latin.

Lingua franca är den gemensamma beteckningen för alla språk som används i internationell eller interetnisk kommunikation, men i egentlig, ursprunglig mening är lingua franca detsamma som sabir. Sabir var ett historiskt belagt pidginspråk som uppstod kring Medelhavet under det elfte århundradet och användes i området ända fram till det nittonde. Ordförrådet var för det mesta baserat på de romanska språken, grammatiken förenklad som i pidginspråk i allmänhet.

Lingua franca nova är ett konstgjort språk baserat på latinet och de romanska språken. Utvecklaren, den nederländsk-amerikanske psykologen Cornelis George Boeree, offentliggjorde språket på Internet år 1998.

Luxemburgiskan är en västmellantysk dialekt som talas till vardags av den infödda befolkningen i Luxemburg. Som ett mellantyskt mål kombinerar luxemburgiskan element från låg- och högtyskan: på luxemburgiska säger man t ex op i stället för auf, men å andra sidan ich (egentligen ech) i stället för det lågtyska ick 'jag'. Det finns givetvis skillnader även mellan olika luxemburgiska munarter: för 'mellan' säger man zwëschent (jfr ty. zwischen) i sydliga mål, tëscht, tëschent i nordliga dialekter (jfr holländska tussen).

Staten Luxemburg har i stort sett behållit intakt den sociolingvistiska situation som härskade i hela det tyska språkområdet under det s k à la mode-tidevarvet: det är sålunda franskan som är det egentliga kulturspråket, medan det tyska skriftspråket har en lägre status, och folket talar mest sin egen dialekt. Tyska ser man oftast i tidningspressen, lagar utfärdas på franska, men diskussioner på parlamentet förs och protokollförs för det mesta på luxemburgiska. Tyskspråkiga tidningar som utkommer i Luxemburg brukar också vara redigerade för en trespråkig läsarkår: spontana yttringar citeras på luxemburgiska, lagtext på franska.

Luxemburgiskan har eget skriftspråk och egna bokstäver (t ex det lätt igenkännliga ë) som inte används i tyskan. Egen teknisk och vetenskaplig terminologi har däremot inte utvecklats, vilket innebär att det i praktiken är fritt fram att låna in lärda ord från franskan, tyskan och engelskan. Statliga och offentliga institutioner har vanligen bara franska namn, som t ex Police grand-ducale (”Storhertigliga polisen”), som då även används i luxemburgiskan.

Satsläran och satsstrukturen är i luxemburgiskan vanligen något olik standardtyskan, inte bara p g a sin mera talspråkliga prägel, utan även de franska influenserna. Tungrodda litterära eller byråkratiska texter på luxemburgiska gör dock ofta intrycket att vara tyska med luxemburgiska ord, dvs stå under standardtyskt inflytande vad gäller formuleringar och satsbyggnad.

Skillnaden mellan ackusativ och dativ har upphävts i luxemburgiskan, och genitivformen är mycket ovanlig. Prepositionen fir (motsvarigheten till standardtyska für) används i luxemburgiskan i infinitivkonstruktioner, precis som dess motsvarigheter i svenskan (för) och franskan (pour), men inte i standardtyskan (där för att göra så måste översättas t ex med um so zu tun). Liknande konstruktioner förekommer dock även i andra dialekter i regionen, som t ex kölntyskan (Kölsch).

En satsfonetisk specialitet i luxemburgiskan är den så kallade Eifelregeln: om ett ord slutar på -n, så bortfaller denna konsonant om det följande ordet börjar med någon annan konsonant än h, d, t, n eller z [ts]. Får man för sig att lära sig luxemburgiska som utlänning är det nog Eifelregeln (som givetvis har sina egna undantag) man kommer att få det svårast med. Regeln är uppkallad efter Eifelhöglandet i västra Tyskland, i vars dialekt den också gäller.

Det bör dock framhävas att luxemburgiskan trots allt är en tysk dialekt: för den som bara behärskar standardhögtyska är luxemburgisk sakprosa lättare läsning än typisk tysk dialektdiktning.

Maa eller maasaispråket är ett nilotiskt språk som talas i olika dialekter av maasaifolket och flera besläktade etniska grupper i Kenya och Tanzania. Maa är ett tonspråk och har vokalharmoni baserad på tungrotsställningen, alltså lik den som mongoliskan har (och olik den finska och turkiska vokalharmonin). Verbmorfologin är rik – verbformerna visar både subjektet och objektet – men det är vanligt att skillnaden mellan två verbformer med mycket olika betydelse bara hörs i tonerna. Maa saknar även lokala prepositioner och föredrar i stället substantiv med lokaliserande betydelse (”nedre delen”, ”övre delen”, ”utrymmet mellan” osv). Det finns maskulina och feminina substantiv och tredje genus för orter och platser. Substantiv har mycket komplicerad pluralböjning, och pluralformerna är så oregelbundna att man måste lära sig dem utantill.

Maaspråket talas av ungefär en miljon människor och kan sägas vara utrotningshotat på lång sikt, eftersom swahili har en viktig och expansiv roll i samhället både i Tanzania och i Kenya. Många ortnamn – t ex Nairobi – vittnar om maaspråkets tidigare dominans där swahili i dag är förhärskande.

Maithili är det viktigaste av de indoariska språk som talas i den indiska delstaten Bihar. Det är nära släkt med hindi och uppfattas ofta som en dialekt av detta språk, och det är först på 2000-talet som maithili fått någon sorts officiell status. Än i dag har hindi en starkare ställning i Bihar än maithili. Å andra sidan talas maithili även utanför Bihar, bl a i Nepal. Maithili kan och brukar skrivas med devanagaribokstäver, men har traditionellt använt tirhutaskriften, ett besläktat men separat skrivsystem. Likaså finns det en maithilivariant av kaithiskriften, som använts till att skriva flera andra bihariska språk.

Maithili talas av över trettio miljoner människor, lite färre än bhojpuri: det är sålunda det numerärt sett näst största av de bihariska språken. Vissa forskare anser dock att maithili i språkvetenskaplig bemärkelse inte är ett bihariskt språk utan liknar mera bengali (bangla).

Makedoniska – Det här namnet betecknar två olika språk:

Historiskt: I historiska sammanhang avser ordet ”makedoniska” det språk som talades av Alexander den stores undersåtar i det forntida Makedonien. Alexanders dynasti, argeaderna, var av grekisk härstamning, och det är troligt att hans hov talade grekiska, men frågan om det vanliga folkets språk i Makedonien är knepigare: det är nämligen välkänt att grekerna såg ned på makedonierna och uppfattade dem som uppkomlingar utan särskilt trovärdiga grekiska anor. Detta har lett till rätt vilda spekulationer om det språk som de forntida makedonierna talade. Arkeologiska fynd och kvarlevor tyder dock på att fornmakedoniskan egentligen var en grekisk, snarast dorisk, dialekt eller en nära släkting till grekiskan.

Samtida: Det språk som i dag talas i den före detta jugoslaviska republiken Makedonien utgör inte någon fortsättning till det fornmakedoniska språket, utan är ett sydslaviskt språk, nära besläktat med bulgariskan. Skriften är kyrillisk men liknar mera den serbiska än den bulgariska varianten; dessutom har makedoniskan flera bokstäver som inte används i något annat språk. Ordförrådet är mindre kyrkslaviskt influerat än i bulgariskan: den makedoniska språkvården eftersträvar medvetet ett folkligt präglat skriftspråk.

Malagassiska – Malagassiskan är det officiella språket i Madagaskar, där det hörs en del olika dialekter och språkformer som alla är sinsemellan besläktade även om de inte alltid är ömsesidigt förståeliga. Den riktgivande dialekten är den som talas av höglandsmalagassierna eller merinafolket, även politiskt den ledande etniska gruppen i republiken.

Malagassiskan är ett malajisk-polynesiskt språk och liknar mest de språk som talas vid Baritofloden på Borneo. Den har tagit upp en del låneord från engelskan, franskan och de bantuspråk som talas i östra Afrika.

Som alla malajisk-polynesiska språk har malagassiskan rätt få böjningsformer. De mest markanta är verbens tempusformer, som uttrycks med förstavelser: miasa 'arbetar', niasa 'arbetade', hiasa 'ska arbeta'. Skillnaden mellan adjektiv och verb är inte tydlig i språket, och åtminstone en del adjektiv kan också ha liknande former.

Malagassiskan har olika pronomen för inklusivt och exklusivt 'vi' (dvs. 'jag och du' respektive 'jag och mina vänner, men inte du'): isika och izahay. Det här är också typiskt för malajisk-polynesiska språk.

Maliseet-passamaquoddy är ett östalgonkinskt språk som talas av fyra-femhundra människor i Kanada och Förenta Staterna. Det indelas i två dialekter, maliseet och passamaquoddy, och är närmast släkt med micmac. Som infödingsspråk i Amerika brukar vara är det ett polysyntetiskt, inkorporerande språk.

Maltesiska – Maltesiskan är ett semitiskt språk, egentligen en arabisk dialekt, som talas i republiken Malta, dvs öarna Malta och Għawdex (Gozo) – de andra öarna i arkipelagen, Kemmuna (Comino), Kemmunett (Cominotto) och Filfla, har föga eller ingen bosättning. En del malteser brukar insistera på att deras språk egentligen skulle ha utvecklat sig i feniciskan, som vid ett skede dominerade på ön, men alla professionella språkvetare är i dag ense om att maltesiskan är av arabiskt ursprung. Visserligen har det maltesiska ordförrådet tagit upp så mycket italienskt (egentligen sicilianskt) och engelskt lånegods att det nästan bara är grammatiken som är semitisk; i dagens maltesiska är oassimilerade engelska lånord mycket vanliga. En idrottsplats heter på maltesiska – även i officiell lagtext – grawnd tal-isports, från engelskans sports ground. Ett märkligt exempel på maltesiskans blandspråkliga natur är ordet weldjatura 'svetsfog', som börjar på engelska, slutar på italienska och har ett semitiskt element som en sorts svetsfog (!) däremellan.

Substantiv från italienskan kan ha arabiska brutna pluralformer: furketta 'gaffel', frieket 'gafflar', storja 'historia', stejjer 'historier', men det är också vanligt med ett italienskt -i i plural. Verb böjs på arabiska, även verb av italienskt eller engelskt ursprung: nirrappreżenta 'jag representerar', tirrappreżenta 'du/hon representerar', jirrappreżenta 'han representerar', nirrappreżentaw 'vi representerar'.

Det är praktiskt taget alla malteser som talar språket, men den allmänna inställningen mot modersmålet är påfallande nonchalant eller till och med fientlig. Många malteser anser att språket bara utgör en black om foten, och den ökande muslimfientlighen har bidragit sitt till detta språkliga självhat: det är relativt vanligt att träffa en maltes som öppet föraktar sitt modersmål på grund av dess arabiska ursprung. Språkvård och centraliserad terminologiutveckling har inte heller varit populära i Malta, eftersom malteserna delar den engelsktalande världens misstänksamma attityd (”leave your language alone”) mot all medveten språkplanering. Det är först relativt nyligen det uppstått ett språkvårdsorgan för maltesiskan.

Som arabisk dialekt är maltesiskan närmast släkt med tunisisk arabiska.

Manchuiska - Manchuiskan är ett tungusiskt språk som historiskt sett hörde hemma i Manchuriet (i dag Heilongjiang) i nordöstra Kina men som i dag är ett nästan utdött språk. Det största samhälle där det talas manchuiska eller en nära besläktad dialekt står faktiskt att finna i Xinjiang i västra Kina, där det bor en stam kallad xibo eller sibe. De är etniskt inga manchuer, trots att deras språk i praktiken är en dialekt av manchuiskan. I Heilongjiang finns det bara grupper av gamlingar som talar traditionella manchudialekter, låt vara att manchufolket har vaknat till ny medvetenhet om språkets värde, så att det nu finns en aktiv språkrörelse.

Manchuiska studeras fortfarande av kinesiska historiker, eftersom den sista kejserliga dynastin var av manchuisk härstamning och främjade manchuisk litteratur och lärdom – manchuisk skrift, nära besläktad med den mongoliska, kan fortfarande skådas på Förbjudna Stadens tvåspråkiga skyltar.

Ordföljden i manchuiska är vanligast subjekt – objekt – verb. Språket förfogar över ett antal kasusformer, men kasusändelserna kan också tolkas som postpositioner – de bör dock inte förväxlas med genuina postposition, som också existerar i språket.

Maori med långt a är namnet på det polynesiska språk som talas i Nya Zeeland. Det är svårt att säga hur många som egentligen talar maori: många nyzeeländare av maorihärkomst talar bara engelska eller klarar endast en vardaglig konversation på språket. Det räknas med ett femtiotusen människor med mycket avancerade kunskaper i maori. Språket har sedan andra världskriget varit allvarligt hotat, men i dag finns det en återupplivningsrörelse, och språkets status i samhället har förbättrats avsevärt.

Maori är på många sätt ett typiskt polynesiskt språk. Ljudläran är relativt enkel, och några konsonantanhopningar tolereras inte. Det finns skilda pronomen för inklusivt och exklusivt ”vi”; dessutom har pronomina också dual (med särskilda ord för ”vi två, men inte du”, ”du och jag”, ”ni två”, ”de två”). Det har av gammalt funnits två stora dialektgrupper, den ena på Nordön och den andra på Sydön, men dialekterna på Sydön har dött ut, även om de fortfarande kan rekonstrueras genom att studera ortnamnen på ön: ett typiskt dialektdrag var k i stället för ng.

Maori är närmast släkt med rarotongesiskan som talas på Cooköarna och vars talare också kallar sitt språk för maori. På Chathamöarna talades ett annat besläktat språk, moriori, som dock i dag är utdött, låt vara att moriorifolket som en särskild etnisk enhet fortfarande existerar.

Maori skrivs med latinskt alfabet, varvid det enda diakritiska tecknet är makron, strecket som placeras ovanför vokalen för att beteckna vokallängd: på maori skrivs namnet på språket sålunda māori.

Meänkieli eller tornedalsfinska är en form av finska som talas på den svenska sidan om den finska västgränsen. Meänkieli ('vårt språk', jfr högfinska meidän kielemme eller mera talspråkligt meidän kieli) är nära släkt med de dialekter som talas i det s k Nordbotten (fi. Peräpohjola) i Finland. Den största skillnaden mellan meänkieli och dessa dialekter är att meänkieli inte utvecklats i kontakt med det finska riksspråket: sålunda är benämningarna för moderna föremål och företeelser i meänkieli svenska lånord, medan de på finska sidan är finska nyord. Å andra sidan uppfattas på finska sidan de svenskinspirerade meningsstrukturer som förekommer i meänkieli ofta som tungrodd byråkratfinska av den sort som sedan länge bekämpats av finsk språkvård.

Meänkieli är för det mesta begripligt för en finne som är förtrogen med svenska språket och/eller västfinska dialekter, ty i sin traditionella form är dessa nästan lika svenskinfluerade som meänkieli. Likaså hjälper det givetvis att vara insatt i dialekterna i finska Tornedalen.

Micmac eller mi'kmawisink är ett algonkinskt språk som talas av ett tiotusental micmacindianer i Kanada och Förenta Staterna. Det tillhör den östliga grenen av de algonkinska språken och är sålunda nära släkt med maliseet-passamaquoddy och abenaki. Micmac skrivs med latinska bokstäver, men har av gammalt haft eget skriftsystem, de s k micmachieroglyferna.

Miskito är ett misumalpanskt språk som talas av ett hundratusental människor i Nicaragua och Honduras och det enda språk i denna lilla språkfamilj som ännu är livskraftigt. Miskito har tre vokaler och ett konsonantsystem som inte gör ett särskilt exotiskt intryck; det är inte ett tonspråk. Formläran är baserad på ändelser och infix. Ordförrådet innehåller en del spanska, men det är engelskan som av gammalt varit viktigare som källa av lånord.

Miskito talas mest på Nicaraguas östkust, som länge lydde under brittisk överhöghet och sålunda liknar kulturellt mera sådana engelsktalande karibiska öriken som Jamaica. Det förhärskande språket i regionen är en kreoliserad engelska, och det är det här språket som för närvarande utgör ett större hot mot miskitos överlevnad än spanskan.

Mon är ett utbrett minoritetsspråk i Burma. På forntiden var Monriket ett mäktigt och viktigt rike i Irawadidalen i vad som i dag är Burma, men sedan elfte århundradet e Kr har monspråket förlorat sin tidigare uppskattade ställning i samhället och förtvinat. Monskriften var föregångare till dagens burmesiska skrift, och monspråket har överhuvudtaget lämnat djupa spår i burmesiskan.

Mon är ett mon-khmer-språk och sålunda avlägset besläktat med kambodjanskan och vietnamesiskan. Det är inte ett tonspråk; däremot skiljer monspråket på vokalkvaliteter på ett sätt som kan jämföras med motsättningen mellan stød och avsaknaden av stød i danskan.

De montalande är inte så få – antalet uppskattas vara närmare en miljon – men de lever i små utspridda samhällen som inte har stöd av varandra. Därför anses monspråket vara utrotningshotat. Skriftspråket lärs ut endast i buddhistiska kloster.

Mongoliska är det officiella språket i Mongoliet, men mongoliska dialekter, eller kanske närbesläktade språk, talas vitt både i Kina och i Ryssland. Det är svårt att säga var mongoliskan slutar och ett besläktat språk tar vid, inte minst därför att hela den mongoliska språkfamiljen alltjämt är kompakt och dess medlemmar mycket nära släkt sinsemellan. Den mongoliska som utgör grundvalen för standardspråket i Mongoliet är den s k khalkhadialekten; i Kina är det chakhardialekten som har största prestige.

Ofta anses mongoliska språk och turkspråk höra hemma i en s k altaisk språkfamilj, men den altaiska hypotesen är alltjämt omstridd: det har visat sig omöjligt att utarbeta ett gemensamt protospråk för turkspråk och mongoliska språk trots att dessa två språkgrupper företer en hel del strukturella likheter, som agglutinerande grammatik och vokalharmoni.

Mongoliskan är rik både på verbformer och kasusformer, men några personändelser har mongoliska verb inte, i motsats till finsk-ugriska och turkspråk. Mongolisk vokalharmoni är inte baserad på främre och bakre vokaler som t ex i finskan och turkiskan, utan på tungrotsställningen.

I Mongoliet skrivs språket med kyrilliska bokstäver, medan de övriga mongoliska områdena föredrar det klassiska mongoliska skrivsystemet. Det är en vertikal skrift med tecken för både vokaler och konsonanter som egentligen är en tillämpning och vidareutveckling av det sogdiska alfabetet – sogdiskan var ett iranskt fornspråk som talades i vad som i dag är Tadzjikistan och Uzbekistan. Av samma ursprung, t o m nära besläktad, är manchuskriften. Den kyrilliska mongoliskan i Mongoliet är ett modernt talspråksbaserat skriftspråk, medan det klassiska skriftspråket återspeglar ett äldre uttal.

Mongoliskan har lånat in en hel del från tibetanskan och kinesiskan; senare har ryskan och på sistone även engelskan blivit viktiga källor av nya ord.

Motu är ett malajisk-polynesiskt språk som talas i Papua-Nya Guinea, främst kring huvudstaden Port Moresby, som ligger mitt i vad som varit motufolkets traditionella bosättningsområde. Motu talas som modersmål av några tiotusen människor, vilket innebär att det är ett av de större språken i staten.

Motu är en relativt typisk representant för sin språkfamilj med sina rena vokaler, sina få konsonantfonem och sina två pronomina för inklusivt respektive exklusivt 'vi'. Som de övriga malajisk-polynesiska språken i området har motu dock influerats av de papuanska infödingsspråken, vilket återspeglas bl a i ordföljden.

Motu bör inte förväxlas med hiri motu, som är ett av de officiella språken i Papua-Nya Guinea. Hiri motu är ett pidginspråk som utvecklat sig från motu och kommit att användas som lingua franca, men som under de senaste årtiondena fått ge vika för tok pisin, den papuanska pidginengelskan.

Muong är den samlande beteckningen för ett antal dialekter som talas i norra Vietnam av muongfolket, som är en särskild etnisk grupp med egna seder. Dessa dialekter ingår i viet-muonggrenen av de austroasiatiska språken tillsammans med vietnamesiskan. De är inte nödvändigtvis mera släkt med varandra än med vietnamesiskan; den mest markanta skillnaden mellan vietnamesiskan och muong är att muongspråket mera påverkats av taispråk, medan kinesiska influenser varit förhärskande i vietnamesiskan.

Nahuatl Nahuatl var i sin klassiska form det språk som hade officiell ställning i det aztekiska riket. Än i dag finns det åtminstone en miljon nahuatltalande i Mexiko, men språket har sönderfallit i olika dialekter som inte alltid är ömsesidigt förståeliga. Det finns dock en rik litteratur som uppstått under femton- och sextonhundratalet och som är ett ymnighetshorn av information om aztekernas liv och kultur före och snart efter den spanska invasionen.

Nahuatl hör hemma i den uto-aztekiska språkfamiljen: besläktade språk (som t ex shoshone, paiute, comanche, pima-papago/o'odham, tarahumara) talas både i Mexiko och i Förenta Staterna. Det utrotningshotade pipilspråket i El Salvador är egentligen en dialekt av nahuatl.

Nahuatl är ett polysyntetiskt språk med en rik verbböjning. Ett för flera uto-aztekiska språk gemensamt drag är att substantiv ofta har reduplikativa pluralformer, dvs att en del av ordstammen upprepas i plural, t ex coyotl prärievarg’, plural cocoyo.

Nahuatl skrivs med latinska bokstäver, oftast i mer eller mindre spanskinfluerad rättskrivning, vilket vållar en hel del svårigheter, eftersom nahuatl har ett hörbart [h]-ljud, något som spanskan inte har. Nahuatlordet eecatl 'vind' uttalas t ex [ehe]-.

Nama eller khoekhoe är det viktigaste av de s k khoisanspråken, som utmärker sig med klickljud. Nama talas av två-trehundratusen människor, mest i Namibia. Nama är ett tonspråk och har nasala vokaler. Dess närmaste släkting är griekwa eller khoemana, ett nästan utdött språk som förr talats av det s k griekwa- eller griquafolket. Griekwafolket existerar fortfarande som en etnisk grupp, men har övergått till afrikaans.

Navajo är ett sydathabaskiskt språk och numerärt starkast av alla i denna gren. Alla andra sydathabaskiska språkformer kallas för apachiska, men detta namnskick motsvarar inte någon viktig släktskaps- eller förståelighetsgräns, och de apachiska språken liknar varandra knappast mera än de liknar navajo.

Navajo är ett agglutinerande eller polysyntetiskt språk med en rik verbböjning – det är ett verbcentrerat språk som klarar sig med relativt få substantiv. I stället för adjektiv har navajo verb med adjektiv betydelse (för ”röd” används alltså ett verb som betyder ”att vara röd”).

Naxi är ett tibetoburmanskt språk som talas i Yunnanprovinsen i södra Kina av trehundratusen människor. Naxi liknar typologiskt de språk som talas i omgivningen: det är alltså ett isolerande tonspråk som t ex kinesiskan. Det ingår i en liten grupp närbesläktade naiska språk som även innefattar bl a mosuospråket – den officiella kinesiska minoritetspolitiken ser mosuo och naxi som en enda etnisk grupp. De naiska språkens exakta ställning inom de tibetoburmanska språken är ännu omstridd: de kinesiska språkvetarna föredrar att klassificera dem i samma gren med yispråket (lolospråket, även det ett språk som talas i Yunnan) och burmesiskan, medan västerländska lingvister tenderar att se dem som nära släktingar till de qiangiska språken (i dag små minoritetsspråk i Yunnan och Sichuan).

Naxispråket är inte akut utrotningshotat, men det skrivs och läses av få. Det kan skrivas med västerländska bokstäver, men har också ett par egna skrivsystem, av vilka dongbaskriften, en bildskrift, är det mest intressanta. Dongbaskriften lever mest i religiösa manuskript utarbetade av bonpräster – bon eller bön är en tibetansk religion som innehåller både buddhistiska och andra element – och det är sålunda motiverat att kalla även dongbatecken för hieroglyfer, ”heliga bokstäver”. Under kulturrevolutionen förföljdes dongbapräster och många manuskript förstördes; i dag försöker myndigheterna i Yunnan återuppliva och uppmuntra den försvagade dongbatraditionen.

Ndebele betecknar två närbesläktade men distinkta bantuspråk i södra Afrika.

Sydndebele är ett av de officiella språken i Sydafrika och talas av en dryg halvmiljon människor, mest i provinserna Gauteng och Mpumalanga. Det är ett ngunispråk, men skiljer sig markant från xhosa och zulu, främst på grund av de influenser det tagit emot från sothospråken.

Nordndebele är det största minoritetsspråket i Zimbabwe. Nordndebele är mycket nära släkt med zulu.

Nepaliska är det officiella språket i Nepal och Sikkim. Det är ett indoariskt språk som skrivs med en lokal variant av devanagarialfabetet och är sålunda släkt med hindi och bengali. Någon ömsesidig förståelse är dock inte möjlig, eftersom nepaliskan under påverkan av obesläktade grannspråk, främst tibetansk-burmanska, utvecklat sig i egen riktning. Nepaliskan har tidigare kallats för gurkhali och khaskura, och det är först relativt nyligen som den kommit att uppfattas som nationalspråket i Nepal.

Newariska eller nepal bhasa är ett tibetansk-burmanskt språk som talas av en betydande minoritet i Nepal; flera närbesläktade men distinkta dialekter eller grannspråk existerar också i regionen. Språket skrivs i dag mest med devanagarialfabetet, men även andra, besläktade skriftsystem av indiskt ursprung har under århundraden kommit till användning. Det finns en rik klassisk litteratur på språket, men på vår tid har newariskan reducerats till ett utrotningshotat minoritetsspråk som håller på att förträngas av Nepals nuvarande nationalspråk, nepaliskan.

Ngäbere eller guaymí är ett chibchaspråk som talas av ett par hundratusen människor främst i Panamá.

Nheengatu är den i dag levande formen av vad som tidigare kallades för língua geral (namnet är portugisiska för ”det allmänna språket”) – det tupibaserade lingua franca-språk som infödingar med olika modersmål talade med varandra under Brasiliens tidiga kolonialperiod. Detta språk utvecklade sig från det nu utdöda tupinambá-språket och främjades som skriftspråk av jesuiterna. Under en kort tid vid slutet av sexton- och i början på sjuttonhundratalet hade língua geral officiell ställning i kolonin, men på sjuttonhundratalet bestämdes det att endast portugisiska kunde användas i officiella sammanhang. Detta innebar en långsam nedgång för língua geral, som dessutom blev föremål för växande portugisiskt inflytande.

I dag talas nheengatu bara av ett par tiotusen människor som modersmål. Språket har officiell ställning endast på lokal nivå.

Norska är vad de skandinaviska språkvarieteter som talas i Norge kallas; i praktiken är det ett brokigt sammelsurium dialekter, som det visat sig omöjligt att skapa en enda skriftlig norm för. Språket har sedan 1800-talet haft två standardspråk: bokmål och nynorsk, vars äldsta former kallades riksmål och landsmål; i praktiken är variationen dock stor även inom både bokmåls- och nynorsktraditionen.

I Norge var det officiella språket under danska väldet (från 1300-talet ända till 1800-talet, då Norge övergick till svenska väldet) danska, ett närbesläktat nordiskt språk som dock på många sätt skiljer sig från det naturliga talspråket i Norge. Medan utbildade norrmän använde danska till skriftliga ändamål, en del (t ex Ludvig Holberg) till sådan fulländning att de blev klassiska författare på danska, talade de ”bildat talspråk” (den dannede dagligtale), som i princip var danska läst högt med norsk fonologi.

Under svenska väldet började norska språket så småningom frigöra sig från danskan. I början rörde det sig mest om folkspråkliga influenser som började förekomma i skönlitteraturen, men senare blev ansträngningarna i den här riktningen allt mera systematiska. En del norrmän ville ha en gradvis förnorskning av det dittills använda danska skrift- och standardspråket, och deras tillvägagångssätt gav upphov till det språk som till en början kallades riksmål och nu bokmål. Andra föredrog att bygga upp en helt ny, delvis folkmål baserad, men delvis rekonstruerad och arkaiserande standardnorska, det som blev känt som landsmål och som nu heter nynorsk. De språkpolitiska tänkarna bakom dessa språkformer var Knud Knudsen respektive Ivar Aasen.

Knudsen eftersträvade en mycket grundlig språkreform, och de former av bokmål som i dag används är betydligt mera konservativa än Knudsens slutliga målsättning. Å andra sidan var Aasens ursprungliga landsmål ett konstgjort, extrapolerat språk med vissa fornnordiska influenser, inte så folkligt och dialektvänligt som dagens nynorska. Aasen skilde också på ”goda” och ”fördärvade” dialekter, vilket i praktiken innebar att hans norm kom att bli mycket västnorskt präglad.

Folklig norska skiljer fortfarande på maskulina och feminina substantiv och är rik på diftonger. Nynorskan återspeglar dessa drag, medan bokmålet, särskilt dess mest konservativa former, har svårt att acceptera dem. Å andra sidan föredrar nynorsk språkvård medvetet skandinaviska ord (t ex von i st f håp för 'hopp, förhoppning', jfr isländska von) och härledningselement framför lågtyska. Det är särskilt s k anbeheitelse-ord (med förstavelser som an- eller be-, eller med suffix som -heit eller -else) som bekämpas. Medan sådana exempel på ”tyskeri” som personlegheit och mogelegheit ('personlighet' respektive 'möjlighet') existerar i språket, har språkvården i stället föreslagit personlegdom och mogleik (jfr isländska möguleiki) – det sistnämnda förefaller dock inte ha slagit igenom, och sjanse eller utveg förefaller vara folkligare alternativ.

Förutom de officiella normerna för bokmålet och nynorskan existerar det en del halvofficiella eller inofficiella standardspråk. Sålunda föredrar t ex konservativt inriktade tidningar och tidskrifter en privat norm som fortfarande kallas vid det gamla namnet riksmål. Det finns också de som alltjämt håller fast vid Aasens ursprungliga landsmål, i dag kallat høgnorsk eller högnorskan.

En intressant alternativ norm för nynorskan var den så kallade Midlandsnormalen. Den utgick mest från dialekterna i Telemark och uppstod som ett kommittéförslag av det norska undervisningsdepartementet i slutet av 1800-talet. Midlandsnormalen blev aldrig föremål för stora kontroverser: det blev en möjlig och tillåten variant av nynorskan, men nådde inte något större fotfäste i officiell språkanvändning. Den användes dock av ett antal uppskattade författare, som prosaisten Arne Garborg (som var med om att utarbeta Midlandsnormalen), lyrikern Olav Aukrust och Eddaöversättaren Steinar Schjøtt.

Under andra världskriget ockuperades Norge av tyskarna och styrdes av en fascistisk marionettregering som ville införa sin egen norm, den s k höviska högnorskan (høvisk høinorsk, i dagens norska rättskrivning høvisk høynorsk). Dessa ansträngningar hade dock inget varaktigt inflytande på norsk språkpolitik, och efter kriget återupptog norrmännen sin språkstrid nästan som om ingenting hänt.

Ett gemensamt standardspråk för alla norrmän, ibland kallat samnorsk, är för närvarande inte ett realistiskt mål. På sistone har motsättningen mellan anhängarna av de två språkformerna snarast ökat: de nyaste justeringarna har skett i konservativ riktning, särskilt i bokmålet, och i dag är det möjligt att skriva nästan rent riksmål utan att avvika från officiella bokmålsnormer. Själva ordet samnorsk har gärna använts i polemiskt syfte av anhängarna av riksmålet för att bekämpa alla förslag att modifiera bokmålsnormen i folklig riktning; därigenom har ordet hamnat i sådant vanrykte att inte ens den språkpolitiska organisation som eftersträvar införandet av ett enda norskt skriftspråk på folklig grundval (”språklig samling på norske folkemåls grunn”), Landslaget for språklig samling, vågar använda det längre.

O'odham betyder 'folk, människor' på det språk, o'odham ñeok eller 'människornas språk', som talas av stammarna tohono o'odham (papago) och akimel o'odham (pima) i Arizona och angränsande områden i Mexiko. De två dialekterna är rätt lika varandra, men omtalas ändå ofta som olika språk. Förutom pima och papago finns det andra närbesläktade språkformer i Mexiko som är åtminstone i någon mån inbördes förståeliga med o'odham. Alla dessa språk ingår i den pimanska grenen av uto-aztekiska språk.

O'odham är ett relativt livskraftigt språk och talas av ett tiotusen människor, kanske även fler. O'odhamordet huhugam ('förfader') används i arkeologernas yrkesjargong i formen hohokam för att beteckna ett forntida kulturfolk i Arizona som o'odhamstammarna förefaller vara besläktade med.

O'odham är en typisk representant för den uto-aztekiska språkfamiljen med sin agglutinerande formlära och sin förkärlek för reduplicerade former. Det är inte ett tonspråk.

Osage är ett siouxspråk som ingår i dhegihaspråken, en gren av de sydliga siouxspråken. Som naturligt talspråk har osage dött ut i början av 2000-talet, men språket studeras och lärs ut fortfarande av stammedlemmarna. Osage är särskilt nära släkt med kansaspråket, som dog ut på 1980-talet, och dessa två språkformer omtalas ofta som ett enda språk, kansa-osagespråket.

Ossetiska eller alaniska språket är det viktigaste av de iranska språk som talas i Kaukasusregionen. Språket skrivs med kyrilliska bokstäver och känns igen på ligaturen æ, som inte existerar i de flesta andra språk med kyrilliskt alfabet. Ossetiska talas i Sydossetien i Georgien och i den autonoma republiken Nordossetien-Alanien i Ryssland; den närmaste släktingen var det språk som talades av den ungerska stammen jász innan den övergick till ungerska.

Som persiskan saknar även ossetiskan genus som grammatisk kategori. Däremot har den ett antal olika kasusformer. Lånorden kommer i dag mest från ryskan och georgiskan. I stället för prepositioner har ossetiskan postpositioner, vilket torde bero på inflytande från omgivande språk, inte minst georgiskan. Verbet har två stammar, från vilka det bildas olika tempus- och modusformer med olika uppsättningar av ändelser; dessutom skiljer det ossetiska verbet på imperfektiv och perfektiv aspekt som ryskan. Perfektiva verb bildas genom att lägga till förstavelser, vilket också påminner om slaviska språk.

Ossetiskan har ingen särskilt hög status vare sig i Georgien eller i Ryssland trots lagstadgad officiell ställning i regionen. Den är inte akut utrotningshotad, men den anses vara ”sårbar”, alltså i ungefär samma situation som vitryskan eller baskiskan.

Pali är theravadabuddhismens liturgiska språk på vilket religionens heliga texter, de såkallade ”tre korgarna” eller Tipitaka, är avfattade. Det är ett indoeuropeiskt språk besläktat med Indiens äldre klassiska språk, sanskrit. Pali var i början en folkligare och talspråkligare språkform än sanskrit, som var ett dött, utlärt språk redan när dess klassiska litteratur uppstod. I dag är dock även pali ett fornindiskt lärdomsspråk och ingens modersmål, och det är något omstritt vilken grupp av nordindiska dialekter pali närmast liknar: det kanske är en utjämningsdialekt med drag från flera folkmål.

Pali har skrivits med många olika alfabet. I Sri Lanka, som har varit ett viktigt centrum för palispråkig lärdom, har den lokala sinhalesiska skriften använts till att nedteckna palitexter. Likaså har monskriften, devanagariskriften, det kambodjanska skriftsystemet och det thailändska alfabetet förekommit. Sedan slutet av artonhundratalet har ett brittiskt forskningssällskap, Pali Texts Society, ägnat sig åt att ge ut palitexter i latinsk transkription.

Papiamento är ett kreoliskt språk som talas i Aruba, Bonaire och Curacao. Det förefaller ha utvecklat sig från en pidginiserad form av portugisiska som sedan uppblandats med spanska; dessutom har holländskan och senare engelskan bidragit med lånord. Dialektskillnaderna mellan de olika öarna återspeglas av de lokala standardspråken. Dessutom råder det delade meningar bland standardiserarna om huruvida stavningen helt borde baseras på papiamentos eget ljudsystem eller beakta rättskrivningen i långivarspråken.

Persiska talas i olika former och dialekter i Iran, Afghanistan och Tadzjikistan, varvid det dock ofta är svårt att säga vad som är en dialekt eller ett närbesläktat språk; det existerar en skriftspråklig tradition som går tillbaka till elfte århundradet. Standardvarieteten i Iran kallas farsi, i Afghanistan dari och i Tadzjikistan tadzjiki. Persiska skrivs i Iran och Afghanistan med en utökad variant av det arabiska alfabetet, men trots de många arabiska lånorden är språket inte besläktat med arabiskan, utan hör hemma i den iranska grenen av de indoiranska språken, som å sin sida hör hemma i den indoeuropeiska språkfamiljen.

Persiskan saknar genusformer och har inte heller särskilda pronomina motsvarande ”han” och ”hon”. Grammatiken är relativt enkel: genitivformer finns till exempel inte, utan det som vi uppfattar som genitivattribut binds till huvudordet med ett e-ljud som kallas ezafe: ”mannens bil” heter sålunda māšīn-e-mard (māšīn 'bil' är givetvis samma ord som ”maskin”). Ezafe är ett flexibelt verktyg som också används med adjektivattribut: māshīn-e-bozorg 'den stora bilen', māšīn-e-kučik 'den lilla bilen'. Verbläran är mera komplicerad och uppvisar skillnader mellan de olika varianterna, särskilt p g a det starka uzbekiska inflytandet på tadzjikiskan.

Farsi, dari och tadzjikiskan är fortfarande i stor utsträckning förståeliga sinsemellan. Detta beror delvis på att den klassiska persiskan alltjämt har stort inflytande på formellt språkbruk i alla tre länder, delvis på att den iranska varianten är ett prestigespråk även i de två andra länderna. I det postsovjetiska Tadzjikistan skrivs språket med kyrilliska bokstäver och ansträngningarna att återinföra den arabiska skriften har slagit fel; dessutom har språket införlivat många ryska lånord. Trots detta gör sig det klassiska och iranska inflytandet gällande även där. Sålunda är det inte sannolikt att de tre standardspråken inom överskådlig framtid utvecklar sig alltför långt åt olika håll.

Pipil eller nawat är en perifer dialekt av aztekspråket nahuatl som av gammalt talats i El Salvador. Språket har under 1900-talet gått kraftigt tillbaka p g a öppna och brutala förföljelser, men främjas i dag av en kulturrörelse. Infödda språkbärare är vid skrivandets stund bara ett par hundra.

En närstående språkform har tidigare talats i Nicaragua, men har sedan artonhundratalet helt försvunnit. Det finns dock en viss litterär dokumentation, främst det folkliga blandspråkiga skådespelet El Güegüence.

Polska språket är ett västslaviskt språk som talas i Polen och av en världsomfattande diaspora: det är 40-50 miljoner människor som har polska som modersmål. Kulturellt är polskan med sin långa, rika och skiftande litterära tradition ett av de viktigaste slaviska språken att lära sig. Som alla slaviska språk skiljer polskan på imperfektiva och perfektiva aspektformer hos verb och har sju kasusformer: nominativ, ackusativ, genitiv, dativ, prepositional, instrumental och vokativ. Vokativ- eller tilltalsformen är alltjämt mycket levande, särskilt i smeknamn (Marysia – Marysiu!). Uppmjukningen av konsonanterna d och t före e och i är starkare än i de flesta andra slaviska språk: sålunda motsvaras det ryska deti 'barn(en)' i polskan av dzieci. Polska språket har också bibehållit två nasala vokaler, ę [ɛ̃] och ą [ɔ̃], som försvunnit från de övriga slaviska språken – visserligen brukar dessa vokaler sönderfalla i en icke-nasal vokal och en nasal konsonant framför de flesta konsonanter, så att t ex ordet dęby uttalas som [dɛmbɨ].

Polska ord uttalas med klara vokaler, och betoningen ligger nästan alltid på den nästsista stavelsen, oberoende om den utgör en del av stammen eller böjningsändelsen. Undantag är vissa verbformer och latinska lånord. Av gammalt har orden haft en bibetoning på första stavelsen; kungörelser genom högtalare eller megafoner, som uttalas med särskild tydlighet, tenderar att ha starkare betoning på första stavelsen.

Portugisiska – Portugisiskan är ett romanskt språk som talas i Portugal och tidigare portugisiska kolonier som Brasilien, Angola, Moçambique och Macao. I Macao är det ett minoritetsspråk, dock med relativt hög status i samhället; i Brasilien är det det förhärskande språket. Angola och Moçambique ligger någonstans mittemellan; bägge länderna har sina egna bantuspråk, men särskilt i Angola är det påfallande vanligt att innevånare av rent afrikansk bakgrund talar portugisiska som modersmål.

Portugisiskan skiljer sig trots det nära släktskapet betydligt från spanskan. De två språken låter helt olika, ty portugisiskan är rik på nasala vokaler och diftonger, även nasala diftonger. Mellan vokaler har konsonanterna n och l ofta helt försvunnit, t ex i ord som pessoa (lat. och sp. persona, person) eller pôr (lat. ponere, sp. poner, sätta, ställa). På grund av de särskilda ljudutvecklingarna i portugisiskan är det mera komplicerat än i spanskan att bilda pluralformer från substantiv.

Europeisk och brasiliansk portugisiska uppvisar en hel del distinkta skillnader, inte minst i uttalet: i Portugal är det vokalerna som försvagas, medan den brasilianska portugisiskan har tydliga vokaler och förenklar konsonantanhopningarna. Medan språken i skrift är inbördes förståeliga, kan särskilt brasilianer ha svårt att begripa europeiskt talspråk. Brasiliansk portugisiska är öppnare mot engelska lånord och innehåller av naturliga skäl även en hel del ord från infödingsspråk, främst tupí-guaraníspråken.

Provensalskan är det språk som av gammalt talats i den franska regionen Provence, där det under medeltiden uppstod egen tradition av hövisk diktning och sångkonst som bars av de s k trubadurerna (ordet trobador är provensalska och betyder egentligen ”finnare”, dvs den som finner de rätta orden). Provensalskan var länge ett viktigt kulturspråk och trubadurdiktningen uppskattades även utanför det provensalska språkområdet; en medeltida besökare i vår värld skulle nog vara mycket överraskad av att se provensalskan undanträngd av franskan, som till att börja med var en snävt nordfransk språkform.

Provensalskan är en variant av occitanskan, som är ett mera omfattande begrepp och avser dialekterna i hela södra Frankrike. I denna grupp av språkvarieteter ingår förutom provensalskan även gascogniskan, auvergnedialekten och några andra distinkta språkvarieteter. De occitanska dialekterna är nära släkt med katalanskan. Det finns de som anser att även katalanskan är en occitansk språkform; å andra sidan tycker andra att det är bättre att inte använda begreppet ”occitanska” alls, eftersom de occitanska varieteterna knappast är närmare släkt med varandra än de är med katalanskan.

Ett historiskt namn på occitanskan är langue d'oc (det finns också ett landskap i södra Frankrike som heter Languedoc), ”oc-språket”. Ordet för ”ja” i språket har utvecklat sig från det latinska hoc, i motsats till langue d'oïl i norra Frankrike, där det är hoc ille som ligger bakom det jakande ordet. Den moderna standardfranskan med sitt oui är naturligtvis ett oïl-språk.

Försöken att återuppliva provensalskan som ett modernt litteraturspråk går tillbaka till Frédéric Mistral, som även vann Nobelpriset i litteratur för sitt på provensalska avfattade diktepos Mirèio – titeln är samma flicknamn som det franska Mireille. Det är dock betecknande att Mistral använde sin egen rättskrivning, inte det klassiskt provensalska Mirelha. Osäkerhet i fråga om rättskrivning och standardgrammatik har karaktäriserat de litterära strävandena på modern provensalska i allmänhet.

I dag talas provensalska och occitanska av några hundratusen människor som modersmål, men det är mycket svårt att exakt bestämma antalet. Provensalskan är inte ett officiellt språk någonstans; däremot har den variant av gascogniskan som talas i Arandalen i nordvästra Katalonien fått officiell ställning åtminstone på lokal nivå.

Punjabi är ett indoariskt språk som talas av fler än etthundra miljoner människor i Indien och Pakistan, låt vara att en del språkformer som ofta omtalas som punjabidialekter ofta anses vara självständiga språk (t ex hindko, siraiki). Punjabi är ett tonspråk och avviker därigenom från de flesta andra indoeuropeiska språk. Kasusformerna är fem till antalet, men systemet håller på att förenklas så att det i praktiken bara är tre kasus som används, förutom i stående uttryck.

Punjabi skrivs antingen med en variant av den persisk-arabiska skriften eller med ett särskilt indiskt alfabet som kallas gurmukhi. Det är vanligen de punjabitalande muslimerna som föredrar den arabiska skriften, medan sikherna går in för gurmukhi.

Purepecha, purhepecha eller tarasco är ett isolatspråk som talas i delstaten Michoacán i Mexiko av ett par hundratusen människor. Formläran är snarare agglutinerande än polysyntetisk. I stället för en motsättning av tonande och tonlösa konsonanter skiljer purepecha på aspirerade och oaspirerade, varvid tonande konsonanter förekommer som allofoner till de oaspirerade. Purepecha har ett halvdussin kasusformer; ordföljden är relativt fri, men subjektet kommer vanligen först. Dialektskillnaderna mellan den s k centrala dialekten och höglandsspråket är såtillvida stora att en del språkvetare ser dem som två olika, men närbesläktade språk; det är höglandsdialekten som talas av de flesta (ungefär tre fjärdedelar eller fyra femtedelar av alla purepechatalande).

Språket har ingen imponerande litteraturhistoria, men används i dag till skriftliga ändamål. Före spanjorernas ankomst till Mellanamerika hade purepechafolket dock egen stat av ingen ringa betydelse, men den har lämnat bara arkeologiska kvarlevor.

Qashqai är både ett nomadfolk i Iran och språket som detta folk talar. Qashqaispråket är ett turkspråk som är mycket nära släkt med azerbajdzjanskan och den egentliga turkiskan i Turkiet, och en del forskare anser att det helt enkelt är en azerbajdzjansk dialekt.

Quechua eller runasimi är ett språk, eller snarare en liten och kompakt språkfamilj av sinsemellan nära besläktade dialekter och varieteter i Anderna. Quechua talas i olika, inbördes mer eller mindre förståeliga former i Peru, Bolivia, Ecuador och även norra Chile; standardiseringssträvandena är dock mera lokala och regionala, så att man vanligen räknar med ungefär ett halvdussin quechuaspråk. Det ansågs länge att quechua var släkt med det andra viktiga infödingsspråket i Anderna, aymara; i dag tycker dock de flesta forskare att likheterna beror på långvarigt, ömsesidigt inflytande.

Quechua är inte ett tonspråk. Det har en relativt enkel fonologi, bl a med bara tre vokaler; grammatiken är mycket regelbunden och använder bl a samma pluraländelser för substantiv och personliga pronomina.

Quenya är det viktigaste av de konstgjorda språk som J. R. R.Tolkien utvecklade för sin romansvit Sagan om ringen och den mytologiska värld som romanerna skildrar. Quenya är förmodligen det enda av Tolkiens språk med en någorlunda sammanhängande grammatik, men reviderades flera gånger om av författaren, och de försök till läroböcker i quenya som Tolkienentusiaster med språkvetenskaplig utbildning har gett ut brukar vara sina författares personliga tolkningar av vad Tolkien avsett.

Quenya har inspirerats av de klassiska språken (latinet och forngrekiskan), men uppvisar även en hel del finska influenser. Språket har ett antal kasusformer och en agglutinerande formlära.

Rajasthani – Rajasthani är ett indoariskt språk som talas i den indiska delstaten Rajasthan och skrivs med devanagaribokstäver. Språket är nära besläktat med gujarati.

Rapa nui är infödingsspråket på Påskön. Det är ett polynesiskt språk som är närmast släkt med marquesiskan, men har tagit emot starka influenser från andra språk i språkfamiljen, så att dess exakta klassificering inte är en enkel sak. Påskön är politiskt en del av Chile, vilket innebär att även spanskan har stark ställning på ön och har påverkat rapa nui.

Romani är ett indoariskt språk som talas i olika dialekter av romer i hela västvärlden, i Östeuropa och i Nya världen. Dess närmaste släkting är punjabiskan i Indien och Pakistan. Alla romanidialekter är starkt influerade av det lokala översittarspråket, och många lärs ut bara som arvsspråk och hemliga språk, medan modersmålet är en dialekt av majoritetsspråket. Det är också vanligt med s k pararomanispråk, dvs blandspråk där det mesta av ordförrådet kommer från romani medan grammatiken är baserad på majoritetsspråket. Östeuropeiska och balkanska romanidialekter talas fortfarande av hundratusentals människor som modersmål.

Rumänska språket är det officiella språket i Rumänien. Egentligen borde det kallas dakorumänska språket, eftersom det finns ett antal distinkta, men nära besläktade språk i Balkan, som ingår i de romanska språkens östliga gren. Dakorumänska talas förutom Rumänien även i Moldova; det finns också en dakorumänsktalande (valakisk, vlachisk) minoritet i Serbien.

Rumänskan skiljer sig markant från de västliga romanska språken: den har t ex bevarat en hel del av det latinska kasussystemet. Det balkanska inflytandet har varit markant: rumänskan har tagit upp en hel del gemensamma balkanska drag, som t ex den suffigerade artikeln. Slaviska språk har bidragit med en massa lånord; å andra sidan har Frankrike utgjort en viktig kulturell förebild, vilket också återspeglat sig i språkets ordförråd.

Rumänska skrivs i dag med latinska bokstäver. Tidigare fanns det en särskilt rumänsk variant av den kyrilliska skriften, som dock under artonhundratalet fick ge vika för det latinska alfabetet; under övergångstiden användes även ett blandat alfabet som innehöll både latinska och kyrilliska bokstäver. Efter andra världskriget infördes i den av Sovjetunionen intagna och till en sovjetrepublik ombildade östliga provinsen Moldavien ett nytt kyrilliskt alfabet, som för det mesta var modellerat på det ryska; det språk som skrevs med dessa bokstäver var dock i stort sett samma rumänska som i Rumänien. Efter Sovjetunionens fall blev Moldavien självständigt som Moldova och gick helt över till samma skriftspråk.

Ryska språket är det största av de slaviska språken och talas i Ryssland och i före detta sovjetrepubliker; den ryska diasporan är i praktiken världsomfattande. Det är ett östslaviskt språk, men under sin utveckling har ryskan tagit emot väldiga influenser från kyrkslaviskan, ett sydslaviskt (fornbulgariskt) skriftspråk, vilket innebär att särskilt abstrakt och officiell ryska har en mycket sydslavisk prägel. Det är vanligt att ryska ord av folkligt ursprung har konkret betydelse, medan besläktade ord som lånats in från kyrkslaviskan uppfattas som abstrakta och lärda: golova ’huvud’, glava ’överhuvud; kapitel i en bok’; volost’ ’kyrkspel’, vlast’ ’makt’.

Som slaviska språk i gemen skiljer ryskan på ofullbordad (imperfektiv) och fullbordad (perfektiv) verbaspekt; det är dock något vanligare med dubbel aspekt i ryskan än t ex i polskan. Som vanligt i de slaviska språken har även ryska rörelseverb dessutom frekventativa former, som uttrycker upprepad eller mållös rörelse, jfr jechat’ ’åka (i bestämd riktning, mot ett särskilt mål)’ men jezdit’ ’åka omkring’; idti ’gå (i bestämd riktning)’ men chodit’ ’promenera, gå omkring’. I ryskan används dock dylika frekventativa verb även i betydelsen ’nå ett bestämt mål och komma tillbaka’: ja chodil v gastronom ’jag var till matbutiken’. Det här går stick i stäv mot vad det slaviska aspektsystemet i princip går ut på, ty i de flesta slaviska språk är frekventativa verb alltid imperfektiva, medan det behövs ett perfektivt verb för att uttrycka en så avslutad handling som att ha besökt en matbutik.

Verbet ’att vara’ har vanligen inga nutidsformer i ryskan: sålunda säger man t ex ja zdes’ ’jag är här’ (ja ’jag’, zdes’ ’här’). Jest’ används i betydelsen ’finns till, existerar’ (pluralformen sut’ förekommer endast i skriftspråket). Vardagsryskan har inget verb för 'att ha', utan man säger u menja jest' 'hos mig är' i stället för 'jag har'. Det här är en konstruktion som påminner om finskan.

Språket har alltid varit mottagligt för utländska influenser: sålunda har både franskan, tyskan och engelskan lämnat djupa spår i ordförrådet. Under Peter den stores tid var dock holländskan en viktig källa av lånord, eftersom kejsaren studerat skeppsbygge i Nederländerna. I rysk sjöfartsterminologi förekommer det fortfarande nederländska ord, som farvater ’farvatten, segelled’ och namnen på väderstrecken: nord, ost, ziujd, vest (dessa är uteslutande sjömansryska, på vanlig ryska säger man sever, vostok, jug, zapad). Franska lån brukar stå i sammanhang med hövisk förfining (t ex assambleja ’fest, bal, samkväm’), tyska med ingenjörskonst och teknologi (massjtab ’skala’) och engelska med modern poppkultur, datateknik och ekonomi (lejbl ’märke, etikett’, big-bend ’big band, stor jazzorkester’, komp’juter ’dator’).

Ryska språket är ett av de stora världs- och kulturspråken och används i f d sovjetiska länder fortfarande som lingua franca mellan personer med olika modersmål.

Rätoromanska är den samlande beteckningen för fem små romanska språkvarieteter som talas i den schweiziska kantonen Graubünden (Grissons, Grigioni, Grischun). Dessutom uppfattas de i Norditalien talade regionalspråken friuliska (furlanska) och ladinska ofta som rätoromanska språk, men det är långt ifrån alla språkvetare som instämmer.

Namnet rätoromanska härleds från Raetia, en romersk provins ungefär belägen i dagens Graubünden. De språk som talades i denna provins före romarnas ankomst kom av naturliga skäl att lämna djupa spår i den form av vulgärlatinet som befolkningen därefter övergick till, och de rätoromanska dialekterna innehåller fortfarande många ord som härrör sig från denna tid. På senare tid har tyska lånord givetvis fått stor spridning i de rätoromanska dialekterna.

De rätoromanska dialekterna i Schweiz är surselviska, sutselviska, surmeiriska, överengadinska (puter) och nederengadinska (vallader). Alla har eget skriftspråk, men dessutom har det utarbetats ett förenande standardspråk för alla, det s k rumantsch grischun. Detta standardspråk används av förbundsstaten, men lokalt står sig dialekterna dock starkare. Rumantsch grischun används inte gärna ens i kontakter mellan rätoromaner med olika dialektbakgrund; i stället föredrar de tyska, som praktiskt taget alla rätoromansktalande behärskar.

I Schweiz talas rätoromanska språkformer av fyrtio-sextiotusen människor. De starkaste dialekterna är surselviskan och nederengadinskan (valladerdialekten).

Salar är ett turkspråk som talas av sjuttiotusen människor i Kina, mest i provinsen Gansu. Det förefaller att vara nära besläktat med oghuzspråken, dvs turkiskan i Turkiet och dess närmaste släktingar, men är i dag oförståeligt för de andra oghuztalande, mest p g a det starka kinesiska och tibetanska inflytandet. Salar är mest ett talspråk, men det har förekommit experiment att skriva språket, både med arabiska, latinska och kinesiskhärledda bokstäver.

Samiska – Samiskan är inte ett enda språk, utan snarare en hel gren i det finsk-ugriska släktträdet: i stället för dialekter är det nog samiska språk det är frågan om. De samiska språken är sydsamiska, umesamiska, pitesamiska, lulesamiska, nordsamiska, skoltsamiska, enaresamiska, kildinsamiska och tersamiska. Det största språket är nordsamiskan, som har två tre gånger så många infödda språkbärare som de övriga samiska språken sammanlagda. Många av dessa språk är akut utrotningshotade, och det samiska språk som talades kring staden Kemi i Finland försvann redan på artonhundratalet.

Samiska språk indelas i väst- och östsamiska: den östsamiska undergruppen omfattar skoltsamiska, enaresamiska, kildinsamiska och tersamiska. Kemisamiskan liknade mest enaresamiska och ingår sålunda i de östsamiska språken.

Samiska språk liknar typologiskt finskan, men har färre kasusformer. Däremot är stadieväxlingen i samiskan (särskilt i enaresamiskan) mycket mera komplicerad än i finskan: både halvlånga och överlånga konsonanter förekommer, och skriften räcker inte alltid till för att återge alla längdskillnader.

De olika samiska språken har separata skriftspråk: t ex i Finland används både nordsamiska, skoltsamiska och enaresamiska som litteraturspråk. Nordsamiskan har redan rätt gamla anor som skriftspråk, men i de tre länder där språket talas användes länge olika rättskrivningssystem. I Norge och Sverige uppstod den gemensamma s k Bergsland-Ruongortografin på 40-talet, medan Finland länge envisades med sitt eget standardspråk för nordsamiskan; det var först på 70-talet som en universell nordsamisk rättskrivning kom till.

Sango är det gemensamma språket i Centralafrikanska republiken, där det har officiell ställning. I princip är det ett lingua franca-språk som utvecklat sig från ngbandi, ett språk som talas vid Ubangifloden i södra Centralafrika och i angränsande områden i Kongo-Kinshasa. Ngbandi hör hemma i ubangispråken, en liten centralafrikansk språkfamilj.

Sango har lånat in massor av franska ord men har bibehållit en centralafrikansk grammatik, och språkvetarna är inte eniga om huruvida sango är ett kreoliserat språk eller inte. Sango är ett tonspråk med en isolerande grammatik och få böjningselement.

Sanskrit – Sanskrit är den indiska civilisationens klassiska litteraturspråk, som även spelat en mycket viktig roll för indoeuropeisk språkforskning. Sanskrit i sin klassiska form standardiserades av den indiske språkvetaren Panini på 300-talet f Kr, men då var det redan ett inlärt språk och ingens modersmål. Det förklassiska eller vediska sanskritspråket anses däremot på sin tid ha varit ett naturligt talspråk: texterna på detta språk är mycket äldre än klassisk litteratur på sanskrit. Sanskrit har en viss officiell status i Indien, och lånord från sanskrit används i indiska språk ungefär som grekiska och latinska ord i västerländska.

Det finns ingen särskild sanskritskrift, ty sanskrittraditionen har länge varit helt muntlig. I dag är devanagariskriften – den nordindiska skrift som används bl a för att skriva hindi – vanligast, men det är möjligt att skriva sanskrit även t ex med sydindiska och thailändska bokstäver.

Sardiska – Sardiska kallas det romanska språk som traditionellt talats på Sardinien. Det indelas i två huvuddialekter, nordsardiskan (logudoriskan och nuoriskan) och sydsardiskan (kampidanskan). I nordligaste Sardinien är språket inte sardiska i egentlig mening, utan snarare korsikanska.

Sardiskan är ett mycket arkaiskt språk som på många sätt liknar mera latinet än italienskan: medan bokstaven c i italienskan uttalas som [tš] i ord som cento 'hundra', motsvaras den fortfarande av ett hårt [k]-ljud i den sardiska motsvarigheten. Språket innehåller också ord vars ursprung är okänt och som tydligen härstammar från öns förromerska språk.

Serbiska – Serbiskan är en standardiserad variant av det språk som tidigare kallades för serbokroatiska och som vi i dag kunde kalla litterär neosjtokaviska, eftersom alla standardvarianter av serbokroatiska utgår från den dialektgrupp som heter neosjtokaviska. Den serbiska varianten skiljer sig från den kroatiska genom att föredra en något ”balkaniserad” satsbyggnad, dvs genom att undvika infinitivformer: på serbiska är det sålunda mera typiskt att säga moram da putujem (ord för ord ’jag måste att jag reser’), medan kroatiskan hellre säger moram putovati ’jag måste resa’. För den protoslaviska vokal som kallas jat’ skrivs det i serbiskan bara e (såkallad ekavisk dialekt), medan kroatiskan har je eller ije (ijekavisk dialekt). Den serbiska formläran är också mera komplicerad: tempusformer som i praktiken är utdöda i kroatiskt talspråk används alltjämt i serbiskan. Serbiskan är till sitt ordförråd mera mottaglig för internationella lånord än kroatiskan: sålunda föredrar serberna t ex de latinbaserade namnen på månaderna, medan kroatiskan har en egen uppsättning slaviska månadsnamn. Likaså är många namn på kemiska element helt olika i serbiskan och kroatiskan.

Serbiska skrivs ofta med kyrilliska bokstäver, men det är minst lika vanligt med latinska i Serbien.

Den språkform som används i Montenegro liknar mest serbiskan, men montenegrinerna talar ijekavisk dialekt, vilket återspeglas i deras skriftspråk. Det förekommer ansträngningar att bygga upp eget montenegrinskt standardspråk t ex genom att introducera nya bokstäver för uppmjukade konsonanter, men tills vidare förefaller det här vara kontroversiellt.

Serer eller serere talas av en dryg miljon människor i Västafrika (Senegal och Gambia). Språket är närmast besläktat med fula och är sålunda ett niger-kongospråk.

Shona talas av 10-15 miljoner människor i Zimbabwe och de angränsande länderna; det är inte alltid klart vad som är shona i egentlig mening och vad som är närbesläktade dialekter/språk. Standardspråket saknar de i sydafrikanska bantuspråk förekommande klickljuden, men har däremot visslade sibilanter som markeras med v efter s eller z; ett sådant ljud ingår i fackledaren Morgan Tsvangirais efternamn. Shona är ett bantuspråk och utgör med sina nära släktingar en egen gren i det bantuiska släktträdet. Som alla bantuspråk utmärker sig shona med ett klassificeringssystem för substantiv som adjektiv och pronomina kongruerar med.

Shoshone hör hemma i den numiska grenen av de uto-aztekiska språken och är närmast släkt med comanche- och timbishaspråken. Shoshone talas av ett par tusen människor, främst i Nevada, Utah, Wyoming och Idaho. Det finns två eller tre distinkta dialekter. Det förekommer ansträngningar att återuppliva språket och lära ut det till yngre generationer, men den geografiska splittringen försvårar dessa strävanden: det finns till exempel ingen enhetlig standardiserad rättskrivning för språket.

Siksika är namnet på det språk som traditionellt talats av de s k svartfotsindianerna. Det finns flera nationer eller ”stammar” som talar siksikadialekter, både i Kanada (Albertaprovinsen) och i USA (Montana). Språket talas av ungefär femtusen människor, eller en tiondedel av alla svartfots- och besläktade indianer, och det finns ett par distinkta dialekter.

Siksika är ett algonkinspråk, men det är svårt att säga vilka andra algonkinspråk det är närmast släkt med. Forskare har av gammalt brukat behandla siksika, arapaho och cheyenne som en särskild grupp därför att alla tre talas i Great Plains-området, men i dag anses det att denna gruppering bara beror på deras geografiska och kulturella närhet till varandra och att de egentligen inte är mera närbesläktade sinsemellan än de är med de övriga algonkinspråken, om man bortser från senare ömsesidigt inflytande.

Sinhalesiska – Sinhala, singalesiskan eller sinhalesiskan är ett indoariskt språk som talas i Sri Lanka. Dess närmaste släkting är divehi som talas i Maldiverna. Sinhalesiska skrivs med eget alfabet som liknar mera de sydindiska skriftsystem som används för dravidaspråken; som så många andra språk i regionen är även sinhalesiskan ett diglossiskt system med stora skillnader mellan tal- och skriftspråket.

Sinhalesiskan visar starka influenser både från grannspråket tamil och från det språk som tidigare talats av den förindiska ursprungsbefolkningen, det s k veddafolket. Veddaspråket har helt försvunnit, men veddafolket har fortfarande ett eget språk, veddakreoliskan. Veddakreoliskan har eget ordförråd som härstammar från det ursprungliga veddaspråket, men grammatiken och formläran är i princip sinhalesiska. Detta blandspråk är dock helt obegripligt för sinhaleser, ty även det sinhalesiska elementet i språket är ålderdomligt eller dialektalt.

Sioux i ordets strikta mening är detsamma som dakota/lakotaspråket, som talas av teton-, santee-, sisseton-, yankton- och yanktonaistammarna. Dessa dialekter kan indelas i tre grupper, dvs lakota (teton), västdakota (yankton-yanktonai) och östdakota (santee-sisseton); sammanlagt har de flera tiotusen infödda talare. Sioux är ett polysyntetiskt språk och ingår i den västliga grenen av siouxspråken (i vidare mening).

Det är en utbredd missuppfattning att de tre siouxdialekterna är lakota, dakota och nakota, varvid det som i den förstnämnda dialekten är ett l-ljud i de två andra alltid motsvaras av ett d respektive n. Historien är dock mera komplicerad: l-ljudet i lakota motsvaras i olika positioner av d eller n i santee-sisseton och yankton-yanktonai, varvid fördelningen varierar mellan dialekterna. De språkformer (”nakota”) där l-ljudet i lakota alltid motsvaras av n räknas inte längre som sioux i egentlig mening, utan som assiniboine eller stoney. Själva ordet dakota betyder vänner eller allierade.

Slavey är namnet på det nordathabaskiska språk som talas av slavey- och sahtufolken i Kanada vid Stora Björnsjön och väster om den, varvid man vanligen skiljer på nordslavey och sydslavey: det är det egentliga slaveyfolket som talar sydliga dialekter, medan sahtustammen talar nordslavey. Slavey har officiell ställning i Nordvästterritorierna i Kanada. Språket talas fortfarande av ett tvåtusental människor.

Slavey är ett tonspråk.

Slovakiska – Slovakiskan är ett västslaviskt språk som talas i Slovakien och har officiell ställning där. Som ett slaviskt språk skiljer den på perfektiv och imperfektiv (avslutad och oavslutad) aspekt hos verb. Den normativa grammatiken erkänner sex kasusformer (nominativ, ackusativ, dativ, genitiv, instrumental och lokativ), men i praktiken förekommer även vokativformer.

Standardslovakiskan är mest baserad på folkmålen i mellersta Slovakien; både de västliga och de östliga dialekterna skiljer sig markant från dessa. Den skiljer på långa och korta vokaler, varvid diftongerna, som ie och ô [uo], räknas som långa. Som i tjeckiskan kan r och l vara ”vokaler”, dvs stavelsebärande, och i motsats till tjeckiskan kan de även vara långa eller korta, som vanliga vokaler. Ett intressant drag i slovakiskan är synkoperingslagen, enligt vilken en lång vokal i ordstammen vanligen åtföljs av en kort vokal i ändelsen; bortfaller ändelsen helt, så förlängs en kort stamvokal. Det äldre g har i slovakiskan, som i tjeckiskan och högsorbiskan, blivit h, så att det polska drogi och det ryska dorogoj 'dyr' i slovakiskan motsvaras av drahý.

Slovakiskan saknar den tjeckiska bokstaven ř, men däremot har den vissa egna specialtecken, t ex ĺ och ŕ för långt l respektive r, och l' för mjukt (palataliserat) l. Bokstaven ä har i de flesta slovakers uttal sammanfallit med e, men eftersom dess långa motsvarighet i besläktade ord är diftongen ia (i stället för ie), är skillnaden mellan ä och e relevant för standardgrammatiken och har bibehållits i skriftspråket.

Slovakiskan har många ungerska lånord som saknas i tjeckiskan; dess ordförråd är överlag rikt och varierande, och det förekommer att ett begrepp på slovakiska omtalas med flera synonymer, av vilka en liknar den östslaviska, en den polska och en den tjeckiska motsvarigheten. Därför kallas slovakiska språket ibland för ett ”slavernas esperanto”. Slovakiska namn på månaderna är latin, som i de flesta europeiska språk, tjeckiskan däremot har slaviska månadsnamn.

Det slovakiska standardspråket är fortfarande något oklart definierat, och små normjusteringar sker alltjämt ibland.

Sorbiska – Sorbiskan är egentligen inte ett språk utan två, lågsorbiska och högsorbiska; det har funnits en övergångsdialekt, den s k Muskausorbiskan, men den kom aldrig att utvecklas till ett förenande standardspråk. Båda är små, utrotningshotade västslaviska språk som talas i före detta Östtysklands sydöstra hörn, i delstaterna Brandenburg och Sachsen.

Lågsorbiskan ligger såtillvida närmare polskan att det ursprungliga slaviska g-ljudet bibehållits i bägge språken, medan det i högsorbiskan blivit ett h, som i tjeckiskan. Båda språken betonar första stavelsen, men lågsorbiskan har dessutom en sekundär accent på nästsista stavelsen.

Högsorbiskan har bevarat ett mera komplicerat tempussystem än de slaviska grannspråken, som oftast bara har en enda dåtidsform; lågsorbiskan har förutom den vanliga infinitivformen också ett supinum, en form som efter rörelseverb används i stället för infinitiv (ska vi översätta ”jag går och hämtar” till sorbiska, så kommer motsvarigheten till verbet ”hämta” att stå i infinitiv i den högsorbiska versionen, medan den står i supinum i den lågsorbiska). Det för slaviska språk typiska aspektsystemet har i praktiken till stor del kollapsat i sorbiskan, låt vara att de imperfektiva och perfektiva verbformerna alltjämt existerar och kan användas för att särskilt framhäva aspekten. En viktig skillnad mellan sorbiskan och de andra slaviska språken är, att man i sorbiskan alltid bör använda den perfektiva formen när man genom att säga sig uträtta någonting också uträttar det (s k perlokuta eller perlokutionära talakter), t ex i sådana satser som ”härmed svär jag...”, ”härmed förklarar jag...” osv.

Bägge språken har också kvar dualformerna, som gått ur bruk i andra västslaviska språk – det finns alltså särskilda substantivändelser, pronomina och verbformer för ”vi två”, ”ni två”, ”de två”.

På sitt språk kallar sig sorberna för ”serber” och sitt språk för ”serbiska” (serbšćina), men detta innebär ingalunda att de vore språkligt eller etniskt särskilt nära släkt med serberna.

Spanska Spanskan är till sitt ursprung ett iberoromanskt språk, dvs ett romanskt språk som uppstått på Pyreneiska halvön. Sedan dess har spanskan spridit sig till Nya världen i och med att spanska riket koloniserade Sydamerika. Spanskan är sålunda ett av världens största och viktigaste kulturspråk: i dag är särskilt latinamerikansk litteratur på spanska känd och uppskattad i hela världen.

Uttalsmässigt utmärker sig spanskan bl a med följande särdrag:
  • Diftongeringen av ursprungliga korta e-och o-vokaler: terra blir tierra 'land, mark', mors, mortis blir muerte 'död'
  • F- försvagas till h- i uddljud (och h- försvinner i uttalet): filius blir hijo 'son'. Märk dock att denna utveckling ofta uteblir före en diftongerad vokal: focus 'eldstad' blir fuego 'eld', och ferrum motsvaras av hierro 'järn' med parallellformen fierro.
  • Uddljudande konsonantanhopningar som innehåller -l- blir ll- (som sedan kommit att uttalas som [j]): flamma blir llama 'låga', plenum motsvaras av lleno 'full', clamare av llamar.
  • Spanskan har i allmänhet fulla och oreducerade vokaler även i obetonad position, vilket inte är fallet vare sig i katalanskan eller franskan
  • Spanskan saknar nasala vokaler, som däremot är typiska för portugisiskan och franskan

Spanska språket kallas ofta kastilianska, castellano – historiskt sett har det uppstått i de kantabriska bergen och spritt sig därifrån till Kastilien när araberna (morerna) under den kristna återerövringen av Pyreneiska halvön, la Reconquista, dragit sig tillbaka söderut. Det spanska nationaleposet El cantar de mío Cid utspelar sig i Reconquistans tidevarv och beskriver adelsmannen och riddaren Rodrigo Díaz de Vivars bravader i kampen mot morerna – hjälten är även känd under smeknamnen El Cid och El Campeador. Eposet har uppstått ungefär år 1200, men de händelser som beskrivs i det ägde rum på 1000-talets andra hälft, då den historiske Rodrigo Díaz levde. Språket i eposet sägs ofta vara gammal spanska, men det kunde lika bra betecknas som gammal aragonesiska; under alla omständigheter är det en iberoromansk språkform och nära släkt med spanskan.

Standardiseringen av spanskan kom i gång i slutet av femtonde århundradet, ungefär samtidigt som Christofer Columbus (spanska: Cristobal Colón) upptäckte Amerika: år 1492 gav historikern och språkvetaren Antonio de Nebrija ut den första standardgrammatiken för språket.

Spanskan har under sin historia mottagit influenser från gotiskan, arabiskan och de romanska grannspråken, inte minst franskan. På sistone har det engelska inflytandet givetvis gjort sig gällande även i den spansktalande världen, men å andra sidan har den amerikanska engelskan tagit upp många lånord från spanskan. I Nya världen har infödingarnas språk lämnat sina bidrag, men av naturliga skäl tenderar dessa influenser variera regionalt: det är t ex mest i de andiska länderna (Peru, Bolivien, Ecuador) som lånorden från quechuaspråket har större spridning, och på ett liknande sätt har nahuatl, aztekernas språk, mest påverkat den spanska som talas i Mexiko.

Swahili eller kiswahili är det viktigaste av bantuspråken. Som i alla bantuspråk indelas substantiven även i swahili i ett antal klasser, som markeras med speciella klassprefix, varvid adjektiven och verben i satsen står i kongruens med det motsvarande substantivet. Swahili har uppstått i öriket Zanzibar som ett resultat av språkkontakter mellan lokala bantutalande grupper och arabiska köpmän (bl a slavhandlare), vilket förklarar varför språket är rikt på arabiska lånord. Swahili talas som modersmål av bara några miljoner människor, men som andraspråk av många fler, och används i stora delar av Östafrika som lingua franca, dvs som ett samtalsspråk mellan representanter för olika etniska och språkliga grupper. Detta har gett upphov till nya, ofta grammatikaliskt eller fonetiskt förenklade, pidginiserade eller kreoliserade former av swahili.

De dialekter som talas i Komorerna är nära besläktade med swahili men inte nödvändigtvis förståeliga för swahilitalande; de har tagit upp ännu fler arabiska ord än det egentliga swahilispråket. De bantuspråk som swahili utvecklat sig från (de s k sabakispråken) har för det mesta försvunnit eller talas bara av relativt små grupper på afrikanska östkusten: swahili verkar hålla på att tränga undan dem.

Swahili har nått sin väldiga spridning till stor del genom traditionella handelsrutter och arbetsmigration, men missionärerna och kolonialherrarna har också lämnat sitt bidrag till swahilifrämjandet bl a genom att standardisera språket. I motsats till många andra bantuspråk är swahili inte ett tonspråk, vilket underlättar inlärningen.

Swahili har av gammalt talats i områden som i dag ligger i Kenya och Tanzania; tack vare sin ställning som lingua franca är det i dag ett officiellt språk även i Uganda och i Kongo-Kinshasa (före detta Zaire). Swahili har officiell ställning också i en del afrikanska samarbetsorganisationer.

Tadzjikiska – Det här namnet har två betydelser:

Egentlig betydelse: Utanför Kina betecknar tadzjikiskan den persiska dialekt som mest talas i Tadzjikistan och Uzbekistan. Tadzjikiskan är inte mycket olik persiskan i Iran, men den uppvisar en hel del influenser från både turkspråken (särskilt uzbekiskan) och ryskan. I de exsovjetiska länderna skrivs språket med kyrilliska bokstäver.

I Kina: Den officiella språkpolitiken i Kina är att beteckna de små iranska språk som talas i Pamirbergen som tadzjikiska, eftersom närbesläktade språk även talas på den tadzjikiska sidan om gränsen. Dessa språk hör dock hemma i en helt annan undergrupp av iranska språk än persiskan och är inte ens inbördes förståeliga. De viktigaste pamirspråken torde vara shughni, sarikoli och wakhi, men dessutom finns det flera andra som det är svårt att klassificera som språk eller dialekter. De flesta ”tadzjikisktalande” i Kina talar troligen sarikoli, men språket har ingen officiell ställning.

Tagalog är det officiella språket i Filippinerna och ett av de malajisk-polynesiska språken. Traditionella tagalogdialekter talas av ungefär trettio miljoner människor, men man kan i princip räkna med att alla vuxna i Filippinerna behärskar någon sorts tagalog. Språket hör hemma i den centralfilippinska gruppen och är sålunda relativt nära släkt med bikol och de visayanska språken (cebuano, hiligaynon, waray osv). Som alla språk i Filippinerna har tagalog tagit upp många spanska och engelska lånord.

Tagalog som officiellt språk kallas ofta för ”filippinska” (filipino eller pilipino), och det är en språkpolitisk tvistefråga huruvida ”tagalog” och ”filippinska” är samma språk. En möjlig tolkning av kontroversen är att ”tagalog” främst avser de traditionella dialekterna eller litteraturspråket, medan ”filippinska” är den ledigare lingua franca-form av språket som utvecklats i metropolområdet Manila och som inte nödvändigtvis talas som modersmål.

Tamil – Tamil är den mest kända representanten för dravidaspråken, en självständig sydindisk språkfamilj. Tamilspråket talas i de indiska delstaterna Tamil Nadu och Puducherry (Pondicherry), i den självständiga republiken Sri Lanka och av en världsomfattande diaspora; det har också officiell ställning i Singapore. Tamil är ett gammalt kulturspråk med uråldriga litterära anor och uppskattas sålunda som ett av Indiens klassiska språk. Det är ett agglutinerande språk rikt på böjningsändelser och former, och skillnaden mellan det klassiska skriftspråket och mera talspråksnära stilar är stor. I motsats till många andra indiska språk undviker tamil lånord från sanskrit: i stället är lärda termer ofta baserade på dess eget språkgods. Tamil skrivs med ett eget alfabet.

Tarahumara eller raramuri talas av ungefär hundratusen människor i delstaten Chihuahua i Mexiko. Det är ett uto-aztekiskt språk och utgör tillsammans med det nära besläktade guarijíospråket en egen gren i det uto-aztekiska släktträdet; i övrigt är det en relativt typisk representant för språkfamiljen. Tarahumara används som hjälpreda på lägsta nivån i skolundervisning, och det finns radiosändningar på språket.

Tatariska – Tatariska i ordets egentliga mening, eller volgatatariska, talas i den autonoma republiken Tatarstan i Ryssland och i angränsande områden; den har också en stark ställning i grannrepubliken Basjkirien (Basjkortostan), där det lokala språket är mycket nära släkt med den, så att många basjkirer föredrar tatariska som skrift- och kulturspråk. Tatariskan är ett turkspråk och utmärker sig med de drag som är typiska för denna språkfamilj, som vokalharmoni och agglutinerande, strängt regelbunden formlära.

Ryska språket har under århundraden haft ett enormt inflytande på tatariskan, och ryska lånord, både nya och väl inarbetade, är vanliga i språket. Det är oftast det kyrilliska alfabetet som används för att skriva och trycka på tatariska; efter sovjetmaktens kollaps försökte tatarerna införa en latinbaserad skrift för språket, men den ryska överheten har bekämpat sådana experiment med lagstiftning.

Förutom volgatatariskan finns det ett antal andra turkspråk som kallas tatariska men som inte nödvändigtvis är särskilt nära släkt med den egentliga tatariskan. Det mest kända av dessa är krimtatariskan, men dessutom finns det ett sibirientatariskt språk och ett antal små turkspråk som också ibland kallas tatariska. Den form av tatariska som talas i Finland är baserad på den misjäriska dialekten av volgatatariskan.

Telugu – Telugu är ett dravidaspråk som talas av fler än 70 miljoner människor i delstaten Andhra Pradesh i Indien (Andhra är ett alternativt namn på den etniska grupp som talar telugu) och i den nya delstaten Telangana, samt av minoriteter på andra håll. Telugu har fler infödda språkbärare än något annat dravidaspråk. I motsats till tamil har telugu lånat in massor av ord från sanskrit, och som resultat av det långa muslimska väldet i Hyderabadområdet har språket även införlivat en hel del arabiskt och persiskt gods. Telugu skrivs med en egen skrift som mest liknar kannadaalfabetet.

Tepehuanska kan beteckna två språkgrupper:

Uto-aztekiska: Tepehuanska kan syfta på ett par uto-aztekiska språkformer som talas av några tiotusen människor i delstaterna Chihuahua och Durango i Mexiko. Dessa språk är nära besläktade med o'odhamspråken (pima och papago) i Arizona.

Totonakiska: De totonakiska språken indelas i två undergrupper: totonakiska i egentlig mening och tepehuanska. Dessa tepehuanska språk anses vara tre till antalet och talas av sammanlagt ett tiotusental människor vid den mexikanska östkusten.

Tetum eller tetun är det officiella språket i Östtimor, där det i övrigt talas ett tjugotal språk. Egentligen är tetum inte ett språk utan minst två: den form av tetum som används av staten och i kommunikation mellan folk med olika modersmål är en kreoliserad form av språket, medan den ursprungliga variant som talas av det etniska tetumfolket på landet (och i den indonesiska delen av ön Timor) har en betydligt mera komplicerad formlära. Tetum klassificeras som ett av de austronesiska, malajisk-polynesiska språken. Särskilt i sin kreoliserade form har språket införlivat massor av portugisiska lånord.

Tewa, tiwa och towa är tre besläktade språk som talas av puebloindianer i de amerikanska delstaterna New Mexico och Texas. Tillsammans med kiowaspråket utgör de den tanoanska språkfamiljen. Varje språk talas av ett par tusen människor, men varje pueblosamhälle har sin egen dialekt, och det är ingalunda självklart att t ex tiwa är ett enda språk.

Tewa, tiwa och towa är tonspråk. Strukturen är polysyntetisk. Alla dessa språk är mer eller mindre utrotningshotade; återupplivningen har försvårats av dialektskillnader och konkurrerande rättskrivningssystem i olika pueblosamhällen. Dessutom finns det en hel del kulturellt betingad ovilja, t o m rena tabuförbud, mot att införa ett skriftligt standardspråk.

Thailändska – Thailändskan är det största och viktigaste av taispråken och är det officiella språket i Thailand. Strängt taget är det endast den centrala dialekten som används i medier och officiella sammanhang; en stor del av befolkningen talar språkformer som visserligen är släkt med den officiella varianten men tillräckligt olika för att uppfattas som skilda språk. Ett känt exempel är dialekten isan som talas i provinsen vid den laotiska gränsen och som snarare är en form av laotiska.

Thailand är ett buddhistiskt land, och detta återspeglar sig i språket: lånord från sanskrit och pali är rätt vanliga även i det centrala ordförrådet. Engelska lån har ökat sedan artonhundratalet och används, som i många andra språk i världen, av ren flärd, men de har ofta antagit en ny betydelse i thailändskan. Sålunda har det engelska ordet fan, dvs anhängare, supporter eller beundrare, i thailändskan kommit att betyda pojk- eller flickvän; ordet serious har i thailändsk tappning fått en negativ bibetydelse och betecknar en tråkmåns och glädjedödare.

En källa av låneinfluenser är även kambodjanskan: den thailändska som används i kungligheters närvaro är rik på kambodjanska ord.

Thailändska skrivs med en egen stavelseskrift som har utvecklats från den kambodjanska skriften och är av indiskt ursprung. Den thailändska rättskrivningen är baserad på etymologiska och historiska principer: sålunda inkluderar lånord från sanskrit och pali ofta bokstäver som inte alls uttalas.

Som så många andra östasiatiska språk är även thailändskan ett tonspråk. Tonerna kodas in i den thailändska skriften på ett komplicerat sätt: det finns särskilda tontecken, men för att få fram den rätta tonen måste man även beakta om stavelsen är öppen eller sluten och vad för bokstäver som används – det finns vanligen flera bokstäver för samma ljud. Det är alltså inte ett enda enkelt tecken, utan kombinationen av bokstaven, stavelsekvaliteten och tontecknet som tillsammans ger tillkänna vilken ton stavelsen har. Detta innebär dock att ord som i uttalet bara åtskiljs av tonen i skriftlig form ser mycket olika ut.

Thailändskan är ett isolerande språk och har inga böjningsändelser. Däremot är det vanligt med relativt betydelsetomma substantiv som i praktiken fungerar som härledningsaffix i europeiska språk.

Tibetanskan är ett sinotibetanskt språk som talas i det autonoma området Tibet i Kina samt i kulturregionen Tibet, som är något större än det politiska Tibet. Tibetanskan är egentligen ett makrospråk, dvs en grupp nära besläktade men inte alltid ömsesidigt förståeliga språkformer eller varianter som för det mesta delar samma litterära kulturspråk. De tre viktigaste dialekterna i själva Kina är lhasatibetanskan (i det egentliga Tibet), khamstibetanskan och amdotibetanskan. I Kashmir talas ladakhiska, i Bhutan dzongkha och i Sikkim sikkimesiska: dessa bör i sin moderna form ses som självständiga språk, men klassisk tibetanska har fortfarande en viss status i dessa regioner, och övergången från klassisk tibetanska till modernt talspråksbaserat litteraturspråk är förmodligen inte helt avslutad ens i Bhutan, där skoleleverna i dag lär sig dzongkha i st f det klassiska skriftspråket.

Tibetanskan är avlägset släkt med kinesiskan, men skiljer sig typologiskt från den: det är ett språk rikt på böjningsändelser och har bl a flera kasusformer. Det är bara en del av de tibetanska dialekterna som är tonspråk: amdotibetanskan skiljer t ex inte på toner.

Timbisha är ett uto-aztekiskt språk som vid skrivande stund talas av ett hundratal människor kring Death Valley i Kalifornien. Det är ett numiskt språk och närmast släkt med comanche och shoshone.

Tjeckiska – Tjeckiskan är det officiella språket i Tjeckien, ett västslaviskt språk som talas av mer en tio miljoner människor som modersmål. Utmärkande drag för tjeckiskan är att det inte längre finns någon hörbar skillnad på mjukt och hårt l, medan det existerar ett mycket lätt igenkännligt mjukt r (bokstaven ř). L och r kan vara stavelsebärande i tjeckiskan och uppträda som ”betonade vokaler”, vilket syns i sådana ord som srp 'skära', zmrzlina 'glass' och vlk 'varg'.

Efter mjuka konsonanter har alla vokaler i tjeckiskan blivit í, i eller e, vilket gör språket ibland svårt att begripa även för de som behärskar nära besläktade slaviska grannspråk. Dessutom skiljer sig det något arkaiserande skriftspråket en hel del från det allmänna talspråket (obečná čeština) och de mera regionala dialekterna. Sålunda uttalas vokalen ý (i skriftspråket helt sammanfallen med í) i det allmänna talspråket som ej, medan é har blivit till ý (dvs långt i-ljud): mladý 'ung' (nominativ singularis, maskulin) uttalas mladej, och genitivformen mladého blir mladýho i folkmunnen.

Tjeckiskan blev ett litteraturspråk tidigare än polskan, och sålunda finns det ett par tjeckiska lånord i polskans centrala ordförråd (t ex hańba 'skam'; den motsvarande genuint polska formen gańba är i dag föråldrat eller dialektalt). Det slaviska g-ljudet blev i tjeckiskan h, vilket syns i ord som hora 'berg', jfr polska góra, ryska gora.

Det första tjeckiska skriftspråket introducerades av teologen Jan Hus, även känd som föregångare för reformationen och avrättad som kättare, kring år 1400; hans tjeckiska utgick från det samtida talspråket i Prag. Detta innebar dock att språket kom att uppfattas som kätterskt, och under den katolska motreformationen bekämpade kyrkan tjeckiskan. Tyskan trängde helt undan tjeckiskan t ex i Prag.

På 1800-talet blev språket åter föremål för kulturellt intresse, terminologier skapades och ny litteratur skrevs. En nyckelroll spelades av språkforskaren Josef Dobrovský, som i början av 1800-talet gav ut en tjeckisk grammatik på tyska. Den gamla tjeckiskan förblev riktgivande för den litterära och kulturella renässansen, ty samtida folkmål ansågs fördärvade och odugliga till litterär kultivering; sedan dess har det tjeckiska skriftspråket utvecklat sig i mera talspråklig riktning, men skillnaderna är fortfarande stora.

Tjuktjiska talas av ett tiotusental tjuktjier i ryska Fjärran Östern. Det är ett polysyntetiskt språk och hör hemma i den tjuktji-kamtjatkanska språkfamiljen tillsammans med ett par ännu mindre utbredda språk i samma region. Tjuktjiska är ett såkallat paleosibiriskt språk, dvs hör hemma i en av de språkfamiljer som fanns i Sibirien innan turkspråk, finsk-ugriska språk och ryskan började göra sig gällande.

Tjuvasjiska – Tjuvasjiskan är ett mycket avvikande turkspråk som talas i den autonoma republiken Tjuvasjien i Ryssland (huvudstad: Tjeboksary). Medan de andra turkspråken påminner om varandra så mycket att det är svårt att dra förståelighetsgränser mellan dem, är tjuvasjiskan så olik dem att den i början felaktigt klassificerades som ett finsk-ugriskt språk. Den kan sägas utgöra en helt egen gren i stamträdet, och en del forskare har lekt med idén att kalla språkfamiljen den turkisk-tjuvasjiska.

Det anses att det turkspråk som talades av bulgarernas förfäder innan de gick över till slaviska dialekter var nära släkt med tjuvasjiskan. Likaså torde det språk som talades i det forna kazariska riket ha liknat tjuvasjiskan.

Tjuvasjiskan skrivs med kyrilliska bokstäver och har tagit emot en massa ryska influenser. Även i sin egen autonoma republik har den relativt lite mediesynlighet: vid skrivande stund anses tjuvasjiskan inte ännu stå under akut utrotningshot, men språkets framtid på längre sikt är nog oviss.

Tok pisin är den mest välkända formen av pidginengelskan och är sålunda ett språk som genom grammatikalisk förenkling och fonetisk anpassning till de omgivande språken utvecklat sig från engelskan. Numera är det inte längre ett pidginspråk i ordets egentliga mening, utan talas även som modersmål och har sålunda kreoliserats. Tok pisin är ett utbrett språk i Papua Nya Guinea, där det har officiell ställning och har för det mesta trängt undan det tidigare använda lingua franca-språket hiri motu, baserat på det lokala språket motu.

Tok pisin känns lätt igen på suffixet -pela, baserat på det engelska ordet fellow, 'kompis'. Detta suffix läggs till räkneord: tripela 'tre' och enstaviga adjektiv: bikpela 'stor'. Rättskrivningen är helt uttalsbaserad.

Tok pisin bör inte avfärdas som ”dålig engelska”, utan är ett separat, stabilt språk med eget ordförråd och egen grammatik. Sålunda har välkända engelska ord i tok pisin utvecklat nya betydelser: wantaim härstammar t ex tydligen från engelskans one time, men betyder i tok pisin ”(tillsammans) med”; kastom är det engelska ordet custom, men avser i Papua Nya Guinea specifikt de förkristna religiösa sederna och vidskepelserna. Bilong är det engelska verbet belong 'tillhöra', men i tok pisin är det en preposition med genitivliknande betydelse: meri bilong mi 'min fru' (meri 'fru, kvinna' från namnet Mary).

Förutom engelskan och lokala språk innehåller ordförrådet även vissa inslag från tyskan, ty före första världskriget var Papua Nya Guineas nordkust en tysk koloni, Tyska Nya Guinea.

Tok pisin är utsatt för ständigt inflytande från standardengelskan: ord för nya begrepp lånas in som sådana från engelskan. Det är också vanligt att personer som i princip talar tok pisin övergår till standardengelska i uttryck som innehåller räkneord.

Totonakiska språk talas av ett par hundratusen människor i Mexiko, främst på östkusten (i delstaterna Veracruz, Hidalgo och Puebla). Dessa språk utgör en egen språkfamilj, vars släktskapsförhållanden med de andra språken i omgivningen inte ännu är utforskade: för närvarande utreds teorin att de ingår i samma språkgrupp som de mixe-zoqueanska språken (en annan liten språkfamilj i Mexiko). Den totonakiska språkfamiljen indelas i två undergrupper: de egentliga totonakiska språken och de tepehuanska språken (varvid man bör akta sig för att förväxla denna grupp med en annan mexikansk språkgrupp som kallas tepehuansk, nämligen o'othamspråken, som är nära besläktade med o'odham – pima och papago – i Arizona och ingår sålunda i de uto-aztekiska språken).

De totonakiska språken är polysyntetiska, men inte tonspråk. Vokaler uttalade med s k läckande, struphuvudsfärgad röst uppfattas som egna fonem, men i övrigt är vokalsystemet enkelt (tre vokaler).

Tsakoniska Tsakoniskan är en sorts grekiska som talas i landskapet Arkadien på Peloponnesiska halvön. Det är en av de få nygrekiska dialekter som inte är koinébaserade, utan har utvecklat sig från en av de antika dialekterna, den doriska. Därför anser språkforskare att tsakoniskan bör räknas som ett självständigt språk. I dag är tsakoniskan nästan utdöd och talas på sin höjd av några hundra människor.

Tsonga – Tsonga eller xitsonga är ett bantuspråk eller en grupp sinsemellan förståeliga och närbesläktade språk eller varieteter som talas i Sydafrika och Zimbabwe (där den lokala tsongadialekten kallas changani). När man talar om alla tsongaspråk kan man kalla dem tswa-rongaspråk: de tre största tswa-rongaspråken heter tsonga (i egentlig mening), tswa och ronga. Tsonga skiljer på vanliga konsonanter och sådana uttalade med s k läckande röst (breathy voice); språket har också klickljud som lånats in från khoisanspråken, men dessa är mycket mindre typiska för tsonga än t ex för xhosa och zulu. Som shonaspråket i Zimbabwe har även tsonga särskilda visslande s-ljud. Tsonga talas av fler än tio miljoner människor och är ett av de officiella språken i Sydafrika.

Tsotsil eller tzotzil är ett mayaspråk som talas i Mexiko, främst delstaten Chiapas, av trehundratusen människor. Det ingår i den västliga grenen av mayaspråken och är närmast släkt med ts'eltal (tzeltal), som likaså talas i Chiapas.

Turkiska – Turkiskan är det officiella språket i Turkiet och talas där av majoritetsbefolkningen, även om landet är mindre enspråkigt än makthavarna är villiga att medge. Turkiskan är ett välutvecklat kulturspråk och har flera infödda talare än något av de besläktade språken. Den ingår i den oghuziska grenen av turkspråken, vilket innebär att den är särskilt nära släkt med azerbajdzjanskan och turkmenskan samt khorasanturkiskan, khaladj och qashqai i Iran.

Den turkiska som skrevs i osmanska riket var starkt påverkat av arabiskan och persiskan, men sedan dess har språket blivit helt annorlunda. Mustafa Kemal Atatürk, som grundade den moderna turkiska staten, reformerade inte bara samhällsskicket utan även språket: han införde det latinska alfabetet och initierade en språkrenhetskampanj, som ledde till att persiska och arabiska lånord förträngdes av äktturkiska, förment äktturkiska eller västerländska (särskilt franska) ord. En del av dessa nybildningar var rätt besynnerliga blandningar av franska och turkiska element men har ändå kommit att accepteras av den turkiska språkgemenskapen. Ordförrådet har förändrats och förnyats i så snabb takt att den turkiska som Atatürk själv skrev i dag måste översättas för unga läsare: Geoffrey Lewis, en turkolog som specialiserat sig på osmansk turkiska, myntade uttrycket ”katastrofal succé” för att beskriva språkreformens innebörd för turkiska språket.

Det turkiska alfabetet skiljer på i (stor bokstav İ) med prick och I (liten bokstav ı) utan prick; med prick uttalas bokstaven ungefär som ett svenskt i, utan prick som ett ”bakre i”, som det ryska ы. Bokstaven j uttalas i turkiskan som i franskan, dvs som ett ž-ljud. Det turkiska c är som ett engelskt j, dvs ett dž-ljud. Dessas tonlösa motsvarigheter skrivs ş och ç. Y är i turkiskan en konsonant och uttalas som i engelskan och franskan (dvs som ett svenskt j); vokalen y skrivs ü som i tyskan, och även bokstaven ö uttalas som i tyskan (och svenskan).

En något problematisk bokstav är ğ. Teoretiskt – och språkhistoriskt – borde den uttalas som den tonande motsvarigheten till ett tyskt ach-ljud, eller som ett grekiskt gamma (γ – den här bokstaven används också för att återge detta fonem i det internationella fonetiska alfabetet), men detta ljud har försvunnit från de flesta folkmålen i Anatolien, så att bokstaven i praktiken antingen förlänger den närmaste vokalen eller blir en hiatuskonsonant ([w] eller [j] mellan vokaler). De turkspråk som har gått över till ett alfabet baserat på turkiskans och som har kvar [γ]-ljudet återger det givetvis med den här bokstaven.

Som alla turkspråk är turkiskan ett agglutinerande språk rikt på böjningsformer och ändelser. Den har också vokalharmoni, ett drag som är typiskt både för turkspråk och för finsk-ugriska språk som finskan och ungerskan.


Turkmenska – Turkmenskan är ett oghuziskt turkspråk som talas i Turkmenistan, en av de före detta sovjetrepublikerna. Dessutom finns det turkmensktalande minoriteter i grannländerna, som i Iran; det bör dock uppmärksammas, att en del av de språkformer i detta land som tidigare klassificerats som turkmenska enligt dagens uppfattning snarare är azerbajdzjanska dialekter eller utgör en egen varietet (t ex khorasanturkiska). Likaså är det vanligt att beteckningen turkmener används för att beteckna folkstammar som inte nödvändigtvis är särskilt nära släkt med de egentliga turkmenerna, vare sig språkligt eller etniskt.

Turkmenskan skiljer sig inte på något dramatiskt sätt från de andra turkspråken i regionen; turkiskan och azerbajdzjanskan liknar den så mycket att de till stor del är förståeliga för turkmensktalande. Det är dock skäl att märka, att bokstäverna s och z av de flesta turkmener uttalas som [θ] (som th i det engelska ordet thick) och [ð] (som th i det engelska ordet this). Det är alltså normalt att 'läspa' när man talar turkmenska.

Som vanligt i turkspråk har turkmenskan sex kasusformer (nominativ, genitiv, dativ, ackusativ, lokativ och ablativ) och utmärker sig med vokalharmoni. Skriftspråket har sedan nittiotalet varit baserat på det latinska alfabetet; det användes även under trettiotalet, tills man år 1940 övergick till det kyrilliska.

Tyska – Tyska språket, ett av de stora moderna språken i Mellaneuropa, är nationalspråket i Tyskland, Österrike och Liechtenstein samt (tillsammans med franskan, italienskan och retoromanskan) i Schweiz. Även i östra Belgien finns det en officiellt tysktalande region, och i Italien har tyska språket lagstadgad ställning i provinsen Bolzano-Sydtyrolen. Tyska förekommer som skrift- och kulturspråk också i Luxemburg, där dock talspråket är en mellantysk dialekt och det officiella språket franskan. Det finns fortfarande tysktalande även i Namibia (f d Tyska Sydvästafrika). Tyskan är ett germanskt språk och sålunda släkt med holländskan, engelskan och de skandinaviska språken.

Det tyska skriftspråket kallas ofta högtyska, Hochdeutsch, men historiskt sett är det här benämningen på de sydliga dialekter som genomgått den såkallade andra eller högtyska ljudskridningen. Denna skridning syns i ord som Zunge 'tunga', lassen 'låta', Reich 'rike', Hilfe 'hjälp', Pfund 'pund', Apfel pple'. De nordtyska eller lågtyska dialekterna saknar denna ljudskridning, vilket innebär att lågtyska ord ofta liknar mera sina svenska, engelska och holländska motsvarigheter. Historiskt sett är holländskan en lågtysk dialekt som utvecklade sig till ett självständigt språk; ännu på 1500-talet uppfattades den som en del av det tyska språkområdet, vilket även den engelska benämningen Dutch vittnar om (jfr ty. Deutsch, ho. duits 'tyska').

Den högtyska ljudskridningen har inte ägt rum lika konsekvent i alla dialekter. Det är särskilt i västra Tyskland det finns mycket variation: sålunda kan en och samma dialekt ha den högtyska formen das i stället för det lågtyska dat medan auf fortfarande uttalas som op, dvs som i lågtyska. Det är särskilt i Rhendalen som det finns många små dialekter på olika stadier i ljudskridning, och sålunda talas det om rheinischer Fächer, den ”rhenska solfjädern”. Solfjädern syftar på de olika isoglosserna, linjerna på dialektkartan som visar hur gränserna mellan högtysk och lågtysk form av ett visst ord förlöper, och i Rhendalen liknar dessa en solfjäder. Det är i de sydligaste dialekterna som denna ljudskridning har gått längst.

Det är en utbredd missuppfattning att ordet Platt endast avser ”rent” lågtyska dialekter. Egentligen kallas dock även många av dialekterna i ”rhenska solfjädern” för Platt. Ordet betyder egentligen ”förståelig” och brukar åtföljas av ett adjektiv härlett från ett geografiskt namn: Siegerländer Platt, den dialekt på tyska sidan om gränsen som mest liknar luxemburgiskan, talas t ex i området Siegerland kring staden Siegen.

I det tyska skriftspråket har ljudskridningen tillämpats rätt konsekvent. En form som Apfel är egentligen mycket sydtysk: t o m i Frankfurt am Main-trakten är pf inte genuint folkmål, vilket man ser i det dialektala namnet på den lokala ciderliknande drycken, Äppelwoi (äppelvin). På ren högtyska ska det heta Apfelwein. Pf blir folkligt först i Bayern. I de alemanniska dialekter som talas i Schweiz har även ett k i början av ordet förvandlats till ch (med kch som mellanstadium), så att Kind 'barn' heter Chind och klein 'liten' är chlii.

Under medeltiden förekom vissa standardiseringssträvanden, men dessa förenade aldrig hela Tyskland. Medelhögtyskan existerade under högmedeltiden (ungefär de tre första århundradena efter det första millenniet) och var baserad på sydtyska dialekter. På detta språk diktade de medeltida höviska skalderna, som Walter von der Vogelweide, och även det tyska nationaleposet Nibelungenlied nedtecknades på medelhögtyska. Språket i eposet är dock betydligt mera arkaiskt än i hövisk diktning, som dessutom vimlar av franska lånord. Medellågtyskan, som svenskan tog djupgående influenser från, var ett senare fenomen: den nådde sin största spridning under senmedeltiden.

Modern tyska eller nyhögtyska börjar med Martin Luthers bibelöversättning på 1500-talet. Luthers nyskapande roll i tysk språkhistoria är väl bekant, men dess exakta innebörd torde alltjämt vara något omstridd. Själv ansåg han att hans tyska motsvarade redan existerande kanslispråkliga normer; hans stil var dock ovanligt talspråklig och åskådlig och gjorde hans bibelöversättning mycket folkkär. Luthers inflytande var kännbart även i Nordtyskland, och det var hans bibel som inledde lågtyskans tillbakagång som skrift- och litteraturspråk.

På femton-sextonhundratalet blev franska språket mycket populärt i Tyskland. Delvis berodde detta på att tysk adel beundrade den franska smaken och kulturen: dessutom bosatte sig väldiga skaror av protestantiska flyktingar – hugenotter – från Frankrike i Tyskland, vilket innebar vardaglig språkkontakt på alla nivåer i samhället. Det var inte bara adeln utan även borgare och hantverkare som ville förkovra sig i språket: de sistnämnda åkte gärna till Frankrike för att komplettera sin yrkesutbildning. Den situation som nu råder i Luxemburg, där franskan är prestigespråket, den lokala dialekten är vardagsspråket och högtyskan spelar en underordnad roll påminner faktiskt om den som rådde i hela den tysktalande världen under sextonhundratalet.

Det enhetliga litteraturspråket i Tyskland är en produkt av upplysningstiden: grammatikor och ordböcker utarbetades och det uppstod en livlig litterär kultur, som mot slutet av sjuttonhundratalet gav upphov till en klassisk tysk litteratur (Goethe och Schiller).

Tyskan har i sin standardiserade form fyra kasusformer, men genitiv undviks helst i talspråket. Verbböjningen är såtillvida mera komplicerad än i svenskan att verbet har personändelser: ich mache 'jag gör', du machst 'du gör', er macht 'han gör', wir machen 'vi gör', ihr macht 'ni gör', sie machen 'de gör'. Dessutom är det slående att den vanliga och omarkerade tempusformen för dåtid i talspråket, särskilt i södra Tyskland, är perfekt, så att man hellre säger ich habe gemacht än ich machte för 'jag gjorde'. För en del tyskar känns faktiskt imperfektformen, även av hjälpverbet, så främmande och skriftspråklig att det i deras talspråk är naturligare att säga ich habe gemacht gehabt (ordagrant 'jag har haft gjort') än ich hatte gemacht för 'jag hade gjort'.

Det finns en utbredd missuppfattning att tyskan är särskilt puristisk och mån om att undvika lånord. I verkligheten har tyskan lånat in massor av ord från latinet, franskan och i våra dagar engelskan. Språkrenhetssträvandena har varit förbigående modeflugor som gärna löjliggjorts även av samtida tyskar, och de fann inget ovillkorligt godkännande ens i Nazityskland: nazisterna ansåg det överdrivet och onödigt att utrota väl inarbetade utländska lån och använde dessutom gärna lärda ord som eufemismer för sina illdåd (sålunda kallades t ex massavrättningar hellre Exekution än Hinrichtung 'avrättning').

Uiguriska – Uiguriska språket är ett turkspråk som mest talas i den autonoma regionen Xinjiang-Uyghur i Kina, men även i före detta Sovjet (särskilt i Kazachstan). Före nittonhundratalet använde uigurerna en variant av det centralasiatiska litteraturspråket tjaghataj, men i dag har de eget skriftspråk både i Kazachstan och Kina. Under gångna årtionden har språket upplevat flera omvälvningar vad gäller alfabet och rättskrivning: det har experimenterats både med latinska och kyrilliska bokstäver, men i dag har det arabiska alfabetet officiell ställning åtminstone i Kina.

Uiguriskan har lånat in en hel del ord både från ryskan och kinesiskan: av naturliga skäl är det kinesiska inflytandet starkare i Kina, men väl inarbetade ryska och kinesiska lån är kända i hela det uiguriska språkområdet. Språket har alltid karaktäriserats av stark dialektsplittring: man räknar med fyra huvuddialekter. De flesta uigurer talar dock centraluiguriska dialekter, och det är en nordlig variant av centraluiguriskan som utgör grundvalen för standardspråket både i Kina och i Kazachstan.

Uiguriskan talas som modersmål av ungefär tio miljoner människor, av vilka de flesta bor i Kina. Trots trycket från kinesiskan är det inte ett utrotningshotat språk, ty det talas som andraspråk av de flesta icke-uiguriska nationaliteterna i Xinjiang.

I den kinesiska provinsen Gansu lever en liten minoritet som också kallar sig uigurer eller jugurer: en del av denna minoritet talar ett turkspråk som inte är särskilt nära släkt med modern uiguriska, en annan del ett mongoliskt språk.

Ukrainskan är ett östslaviskt språk som talas i Ukraina, särskilt i landets västra delar. Ukrainska språket är nära besläktat med ryskan, men skiljer sig ändå på många sätt från den: ordförrådet är mindre kyrkslaviskt och samtidigt mera polskinfluerat än i ryskan; vokalerna o och e har blivit i i slutna stavelser; det ryska g motsvaras av ett h-liknande ljud; o uttalas inte som [a] i obetonade stavelser; osv. Ukrainskan har också utvecklat egen futurumform som inte förekommer i ryskan: žytymemo 'vi ska leva', jfr ryska budem žit', polska będziemy żyć (även budemo žyty kan dock användas i ukrainskan).

Ukrainska skrivs oftast med kyrilliska bokstäver, som saknar det ryska ы, eftersom detta i uttalet sammanfallit med и. Däremot har ukrainskan en speciell bokstav, і, för det skarpare i-ljud som härrör sig från ett tidigare o eller e.

Det finns ett antal avvikande men med ukrainskan nära besläktade språkformer som kallas rutenska eller rusinska och som talas i Ukraina, Slovakien, Polen och t o m i Vojvodina (Serbien); i Ukraina uppfattas dessa som dialekter, men åtminstone i Vojvodina har den rusinska minoriteten eget standardspråk.

Urarteiska kallas ett fornspråk som talades i östra Mindre Asien och vad som i dag är nordvästra Irak. Urarteiska skrevs med kilskrift, och de språkliga minnesmärken som finns härstammar från 900-700-talet f Kr. Urarteiskan har en struktur som liknar kaukasiska språk bl a med en rad kasusformer, men om det existerar något släktskapsförhållande är tills vidare obekant. Däremot är urarteiskan bevisligen nära släkt med hurritiskan, ett annat fornspråk i regionen.

Ute är en av de numiska dialekter som talas längs Coloradofloden. Som alla numiska språk hör ute hemma i den ute-aztekiska språkfamiljen. Andra varieteter som ingår i samma dialektkontinuum är chemehuevi och sydpaiutedialekten (nordpaiute utgör eget dialektkontinuum).

Venda är ett bantuspråk som talas i Limpopoprovinsen i Sydafrika av drygt en miljon människor som modersmål. Det är ett av de sydliga bantuspråken precis som ngunispråken xhosa och zulu, men ingår inte i samma undergrupp med dem. Venda är ett tonspråk och skiljer på dentala och alveolara variant av d, t, n; dessutom är bilabiala och labiodentala f och v olika fonem i venda.

Vietnamesiska talas i Vietnam, där det är det officiella språket. Som vanligt i regionen är det ett tonalt språk som föredrar enstaviga ord och saknar böjningsändelser, men trots dessa typologiska likheter är vietnamesiskan inte besläktad med kinesiskan, som dock haft ett enormt inflytande särskilt på det vietnamesiska ordförrådet. Vietnamesiskan ingår i viet-muonggrenen av mon-khmerspråken och är sålunda avlägset släkt med kambodjanskan. Närmare släktingar är små minoritetsspråk i Vietnam och angränsande länder; det största av dessa är muong.

Vietnamesiska skrivs med latinska bokstäver, men det används ett antal diakritiska tecken för att återge tonskillnaderna i språket. Det finns också en kinesiskbaserad skrift för vietnamesiskan, som dock i dag främst bara används som en introduktion till kinesiska språket för vietnameser. Den latinska skriften för vietnamesiskan härrör sig från sextonhundratalet, då den franske missionären Alexandre de Rhodes utarbetade den för sin vietnamesiska ordbok, men det är först på 1900-talet som den blivit populär.

Vietnamesiska talas av över sjuttio miljoner människor, och det finns en världsomfattande diaspora.

Vitryska är det nationella språket i Vitryssland, låt vara att det i dag är vanligare och mera uppskattat i republiken att tala ryska, så att vitryskan i praktiken har en liknande ställning som iriskan på Irland. Som ukrainskan har även vitryskan mottagit enorma polska influenser, så att språket ibland liknar polska i östslavisk förklädnad. I motsats till ukrainskan är dentala konsonanter före vokalerna e och i mycket starkt uppmjukade, så att den vitryska motsvarigheten till det ryska deti 'barn[en]' liknar mera det polska dzieci. Som i ryskan uttalas vokalen [o] i vitryskan som [a] före betonad stavelse, men i vitryskan återspeglas detta också i rättskrivningen, så att t ex de sovjetiska nyckelorden kommunism och socialism blir kamunizm och sacyjalizm i vitrysk tappning.

Det finns två standardiserade ortografier: den äldre, utarbetad av Branisłaŭ Taraškievič, och den nyare, som brukar kallas för narkomaŭka, ”folkkommissariatets vitryska”. Taraškievič' rättskrivning är mera polskt orienterad: i konsonantgrupper där den sista konsonanten är mjuk förses även andra konsonanter med uppmjukningstecken (jfr сьмех 'skratt', po. śmiech), medan den nyare ortografin föredrar att inte ha sådana tecken (смех ry. dito). Taraškievič' vitryska kan även skrivas med latinska bokstäver, varvid uppmjukningstecknen används som i polskan (śmiech både på polska och på latiniserad vitryska), medan de polska w, sz, cz motsvaras av v, š, č som i tjeckiskan och slovakiskan.

Wati eller wangka yuti, på engelska ofta Western Desert language eller ”västra ökenspråket”, är ett pama-nyunganskt språk som talas i Australien. Det är ungefär sjutusen aboriginer som har någon watidialekt till modersmål. De watitalande ser sig dock inte som en enda etnisk och språklig grupp, utan uppfattar sina stamdialekter, t ex pintupi och pitjantjatjara, som självständiga språk.

Xhosa är ett bantuspråk av ngunigruppen som talas i Sydafrika. Som ett typiskt bantuspråk utmärker det sig med en strikt kongruens mellan substantiv, adjektiv och verb och en klassindelning av substantiv som visas genom förstavelser. Det är också ett tonspråk, åtminstone i viss mån. Som andra ngunispråk har även xhosa lånat in klickljuden från de obesläktade khoisanspråken, som före bantufolkens expansion var den förhärskande språkfamiljen i södra Afrika.

Xhosa talas som modersmål av ungefär åtta miljoner människor; det är sålunda ett lite mindre språk än det nära besläktade zuluspråket. Det är ett officiellt språk i Sydafrika.

Yanomamö eller yanomami är det största av de yanomamiska språken, som talas av några tiotusentals människor i Venezuela och Brasilien. De yanomamiska språken är nära besläktade med varandra och utgör ett dialektkontinuum. Formläran är starkt polysyntetisk och verbläran komplicerad: verb har både subjekt- och objektböjning. Fonologin utmärks av en motsättning mellan nasala och icke-nasala vokaler, varvid alla vokaler i ett ord bör vara antingen av det ena eller det andra slaget – det är alltså en sorts vokalharmoni. De yanomamiska språken saknar adjektiv och föredrar verb med adjektivisk mening. Yanomamö är ett ergativspråk.

Yoruba är ett niger-kongospråk som talas av minst sextio miljoner människor i Västafrika, särskilt Nigeria och Benin – antalet är i viss mån beroende av vilka språkformer vi räknar som yoruba eller som självständiga men nära besläktade språk. Standardspråket liknar mest dialekten i Oyo och Ibadan (sydvästra Nigeria). Yoruba utmärker sig med ett rikt vokalsystem (dock utan diftonger); det är också ett tonalt språk. Grammatiken är isolerande – några böjningsändelser finns inte, i stället föredrar yoruba separata partiklar.

Yupik (eller yup'ik; ' står för en förlängd konsonant) är den samlande beteckningen för de språk och dialekter som ingår i den eskimåiska grenen av eskimåisk-aleutiska språk men inte är inuitiska. Yupikspråk talas av små grupper i Alaska och Sibirien; för inuitisktalande är de alldeles obegripliga, och även mellan de olika yupikspråken är förståelsesvårigheterna så stora att det är bättre att tala om språk än dialekter. Den viktigaste varieteten är den centralalaskanska, som talas av ett tiotusen människor.

Zapotekiska är ett sextiotal sinsemellan nära besläktade, dock inte alltid inbördes förståeliga språk, som talas i Mexiko, för det mesta i delstaten Oaxaca. Tillsammans med chatinospråken utgör de den zapotekiska (i en vidare bemärkelse) grenen av den oto-mangueanska språkfamiljen. Antalet talare för alla zapotekiska varieteter sammanräknade utgör en halvmiljon, men som sagt är zapotekiskan inte ett enda språk – det kan vara mycket fundamentala skillnader mellan geografiskt närbelägna varieteter.

Zapotekspråken är tonspråk, som vanligt i den oto-mangueanska språkfamiljen. Dessutom brukar de ha nasala vokaler och skilja på enkla och laryngaliserade vokaler. Den typiska ordföljden är verb – subjekt – objekt. Verbmorfologin brukar vara rik och varierande och markera många olika aspekter eller aktionsarter, medan substantiven vanligen är nära nog oböjliga.

Zhuang är en grupp taispråk som talas i södra Kina. Alla de dialekter som i Kina kallas zhuang är inte särskilt nära besläktade sinsemellan, och egentligen är det bättre att säga att alla taispråk i södra Kina officiellt klassificeras som zhuang. Zhuangspråken har av gammalt skrivits med ett system baserat på kinesiska tecken med en del egna inslag, kallat sawndip, men i dag används även latinska bokstäver. Det finns ett standardiserat riksspråk, men dessutom har åtminstone en avvikande dialekt fått eget standardspråk på provinsnivå.

Zhuangspråken är som kinesiskan enstaviga och tonala. När zhuang skrivs med latinska bokstäver, anges tonen med en extra bokstav i stavelseslutet. I en tidigare ortografi var tonbokstaven kyrillisk medan de andra var latinska, men i dag är också extrabokstaven latinsk.

Zulu talas av tio miljoner människor främst i Sydafrika. Zuluspråket ingår i de s k ngunispråken: dess närmaste släkting är det språk som i Zimbabwe kallas ndebele (nordndebele), ty detta språk är i praktiken bara en dialekt av zulu. Zulu talas mest i den sydafrikanska provinsen KwaZulu-Natal.

Som alla ngunispråk är zulu ett bantuspråk med starka influenser från khoisanspråken: det är sålunda rikt på klickljud. Dessutom har zulu naturligtvis tagit upp en massa ord från översittarspråken afrikaans och engelska: hälsningsordet molo är t ex baserat på afrikaansordet môre och sålunda släkt med svenskans morgon.

Zuni eller zuñí eller shiwima talas av ett tiotusental människor i Arizona. Zuni är inte släkt med något annat språk, men lånord och influenser från grannspråken är talrika. Zunifolket är en av de s k pueblostammarna, som har relativt enhetlig kultur, vilket också lett till att språken kommit att likna varandra trots att de inte alltid är besläktade. Zunispråket skiljer sig från många andra pueblospråk i att det inte är ett tonspråk.

Stora hemlandskriget

  Det ryska uttrycket Velikaja Otečestvennaja vojna brukar i västliga länder återges med ”stora fosterländska kriget”. Detta är inte helt f...