Property Value
dbo:abstract
  • Korpusznyelvészetnek nevezünk minden olyan nyelvészeti tevékenységet, mely korpuszokkal, azok vizsgálatával és tanulmányozásával foglalkozik. Szakszóként a kifejezést 1984-től, Jan Aarts és Willem Meijs (szerk.) megegyező című tanulmánykötetének megjelenése óta használják. „A korpusz ténylegesen előforduló írott, vagy lejegyzett beszélt nyelvi adatok gyűjteménye. A szövegeket valamilyen szempont szerint válogatják és rendezik. Nem feltétlenül egész szövegeket tartalmaz és nem csak tárháza a szövegeknek, hanem tartalmazza azok bibliográfiai adatait, bejelöli a szerkezeti egységeket (bekezdés, mondat). Emellett pedig feltünteti a szavak mellett szófaji kódjukat is.” (MTA, Nyelvtudományi Intézet, Korpusznyelvészeti Osztály) A korpusznyelvészet gyakorlatilag minden más nyelvészeti területtel összefonódik, hiszen az empirikus vizsgálatokhoz elengedhetetlen a valós nyelvi adatok vizsgálata. Az ezekből álló korpuszokat rengetegféle szempontból lehet tanulmányozni. Így nyelvészek foglalkoznak a korpuszok létrehozásával, kialakításával és felépítésével is, de a lexikográfusoktól a szociolingvistákig minden terület szakértőinek értékes gyűjtemények és munkaterületek lehetnek ezek. Tom McArthur meghatározásában a korpusz és a korpusznyelvészet:„…A nyelvészetben és lexikográfiában az általában elektronikus adatbázisként tárolt, egy adott nyelvre többé-kevésbé reprezentatívnak tekinthető írott szövegek, szóbeli közlések vagy egyéb minták gyűjteménye. Jelenleg a számítógépes korpusz több millió szót tárolhat, amelyek tulajdonságait címkézéssel (…), valamint konkordancia programok segítségével elemezhetik. A korpusznyelvészet az adatok ilyen korpuszban való tanulmányozását végzi.” (1992: 265–266, ford. Szirmai Mónika) Ahogy az utóbbi meghatározásból is látszik, a korpuszok ma már gyakorlatilag kizárólag elektronikus formában léteznek, hiszen a számítógépek megjelenése és memóriájuk folyamatos bővülése lehetővé teszi, hogy rövid idő alatt addig elképzelhetetlen mennyiségű nyelvi adatot kezeljenek és elemezzenek. Az első elektronikus korpusz, amely később más korpuszok mintájául is szolgált, az 1961-es, Henry Kucera és W. Nelson Francis nevéhez fűződő Brown Corpus volt. Szintén a számítógép és az internet elterjedésének köszönhető, hogy egyre több spontán korpusz is létrejön, amely később érdekes nyelvészeti vizsgálatoknak lehet az alapja. Ilyen korpuszok lehetnek pl. a tanári értékeléseket összegyűjtő RateMyProfessors.com, vagy a különböző dalszövegeket tartalmazó Songtext.com. (A RateMyProfessors korpusz alapú vizsgálatát Karen M. Gregory, a Songtext dalszövegeinek elemzését Valentin Werner végezte.) (hu)
  • Korpusznyelvészetnek nevezünk minden olyan nyelvészeti tevékenységet, mely korpuszokkal, azok vizsgálatával és tanulmányozásával foglalkozik. Szakszóként a kifejezést 1984-től, Jan Aarts és Willem Meijs (szerk.) megegyező című tanulmánykötetének megjelenése óta használják. „A korpusz ténylegesen előforduló írott, vagy lejegyzett beszélt nyelvi adatok gyűjteménye. A szövegeket valamilyen szempont szerint válogatják és rendezik. Nem feltétlenül egész szövegeket tartalmaz és nem csak tárháza a szövegeknek, hanem tartalmazza azok bibliográfiai adatait, bejelöli a szerkezeti egységeket (bekezdés, mondat). Emellett pedig feltünteti a szavak mellett szófaji kódjukat is.” (MTA, Nyelvtudományi Intézet, Korpusznyelvészeti Osztály) A korpusznyelvészet gyakorlatilag minden más nyelvészeti területtel összefonódik, hiszen az empirikus vizsgálatokhoz elengedhetetlen a valós nyelvi adatok vizsgálata. Az ezekből álló korpuszokat rengetegféle szempontból lehet tanulmányozni. Így nyelvészek foglalkoznak a korpuszok létrehozásával, kialakításával és felépítésével is, de a lexikográfusoktól a szociolingvistákig minden terület szakértőinek értékes gyűjtemények és munkaterületek lehetnek ezek. Tom McArthur meghatározásában a korpusz és a korpusznyelvészet:„…A nyelvészetben és lexikográfiában az általában elektronikus adatbázisként tárolt, egy adott nyelvre többé-kevésbé reprezentatívnak tekinthető írott szövegek, szóbeli közlések vagy egyéb minták gyűjteménye. Jelenleg a számítógépes korpusz több millió szót tárolhat, amelyek tulajdonságait címkézéssel (…), valamint konkordancia programok segítségével elemezhetik. A korpusznyelvészet az adatok ilyen korpuszban való tanulmányozását végzi.” (1992: 265–266, ford. Szirmai Mónika) Ahogy az utóbbi meghatározásból is látszik, a korpuszok ma már gyakorlatilag kizárólag elektronikus formában léteznek, hiszen a számítógépek megjelenése és memóriájuk folyamatos bővülése lehetővé teszi, hogy rövid idő alatt addig elképzelhetetlen mennyiségű nyelvi adatot kezeljenek és elemezzenek. Az első elektronikus korpusz, amely később más korpuszok mintájául is szolgált, az 1961-es, Henry Kucera és W. Nelson Francis nevéhez fűződő Brown Corpus volt. Szintén a számítógép és az internet elterjedésének köszönhető, hogy egyre több spontán korpusz is létrejön, amely később érdekes nyelvészeti vizsgálatoknak lehet az alapja. Ilyen korpuszok lehetnek pl. a tanári értékeléseket összegyűjtő RateMyProfessors.com, vagy a különböző dalszövegeket tartalmazó Songtext.com. (A RateMyProfessors korpusz alapú vizsgálatát Karen M. Gregory, a Songtext dalszövegeinek elemzését Valentin Werner végezte.) (hu)
dbo:wikiPageExternalLink
dbo:wikiPageID
  • 1102228 (xsd:integer)
dbo:wikiPageLength
  • 8908 (xsd:nonNegativeInteger)
dbo:wikiPageRevisionID
  • 22478888 (xsd:integer)
prop-hu:wikiPageUsesTemplate
dct:subject
rdfs:label
  • Korpusznyelvészet (hu)
  • Korpusznyelvészet (hu)
owl:sameAs
prov:wasDerivedFrom
foaf:isPrimaryTopicOf
is foaf:primaryTopic of