• Title/Summary/Keyword: Syntax Element

Search Result 42, Processing Time 0.02 seconds

Hate Speech Detection Using Modified Principal Component Analysis and Enhanced Convolution Neural Network on Twitter Dataset

  • Majed, Alowaidi
    • International Journal of Computer Science & Network Security
    • /
    • v.23 no.1
    • /
    • pp.112-119
    • /
    • 2023
  • Traditionally used for networking computers and communications, the Internet has been evolving from the beginning. Internet is the backbone for many things on the web including social media. The concept of social networking which started in the early 1990s has also been growing with the internet. Social Networking Sites (SNSs) sprung and stayed back to an important element of internet usage mainly due to the services or provisions they allow on the web. Twitter and Facebook have become the primary means by which most individuals keep in touch with others and carry on substantive conversations. These sites allow the posting of photos, videos and support audio and video storage on the sites which can be shared amongst users. Although an attractive option, these provisions have also culminated in issues for these sites like posting offensive material. Though not always, users of SNSs have their share in promoting hate by their words or speeches which is difficult to be curtailed after being uploaded in the media. Hence, this article outlines a process for extracting user reviews from the Twitter corpus in order to identify instances of hate speech. Through the use of MPCA (Modified Principal Component Analysis) and ECNN, we are able to identify instances of hate speech in the text (Enhanced Convolutional Neural Network). With the use of NLP, a fully autonomous system for assessing syntax and meaning can be established (NLP). There is a strong emphasis on pre-processing, feature extraction, and classification. Cleansing the text by removing extra spaces, punctuation, and stop words is what normalization is all about. In the process of extracting features, these features that have already been processed are used. During the feature extraction process, the MPCA algorithm is used. It takes a set of related features and pulls out the ones that tell us the most about the dataset we give itThe proposed categorization method is then put forth as a means of detecting instances of hate speech or abusive language. It is argued that ECNN is superior to other methods for identifying hateful content online. It can take in massive amounts of data and quickly return accurate results, especially for larger datasets. As a result, the proposed MPCA+ECNN algorithm improves not only the F-measure values, but also the accuracy, precision, and recall.

Die Korrelation zwischen der DG und GB-Theorie (의존문법과 생성문법 간의 상호관계)

  • Rhie Jum-Chool
    • Koreanishche Zeitschrift fur Deutsche Sprachwissenschaft
    • /
    • v.5
    • /
    • pp.143-166
    • /
    • 2002
  • Das Ziel dieses Aufsatzes liegt darin, auf Grund der Theorien von einigen Grammatikern die Korrelation zwischen der Dependenzgrammatik (=DG) und GB­Theorie(=GB) zu beschreiben. Nach Eroms(2000) sind VPn in eine engere Phrase, die die $Erg\"{a}nzungen$ in obliquen Kasus bindet, und eine $\"{a}u{\ss}ere$, die Subjektsvalenz abbindet, zu trennen. Dem INFL-Phrasenkopf der GB entspricht das Finitheitsmorphem in der DG. In der $herk\"{o}mmlichen$ DG steht das Verb an der Spitze des Satzes, aber Eroms(2000) stellt S an die Satzspitze. Die S(mit S., S?, S!) sind $n\"{a}mlich$ oberstes Element des Satzes, von dem alle anderen $W\"{o}rter\;abh\"{a}ngig$ sind. Die Konjunktionen regieren ihren Satz, bzw. der Satz wird durch sie gesteuert. Damit ist die Analogie zur X-bar-Syntax $vollst\"{a}ndig$. Nach Vater(l996) lasst sich die Struktur der deutschen VP systernatisch nach dem X-bar-Schema darstellen, wobei die Zuordnung der Objekte mehrere $M\"{o}glichkeiten\;zul\"{a}sst$. X-bar-Regeln allein $k\"{o}nnen$ nicht die Vielfalt $m\"{o}glicher$ VP-Strukturen erzeugen. Hier greifen V-bar-Regeln und Valenz ineinander. Vater(l996) $schl\"{a}gt$ vor, den von $\'{A}gel(1993)$ vorgeschlagenen Unterschied zwischen Valenzpotenz und Valenzrealisierung zu $ber\"{u}cksichtigen$, um die verschiedenen syntaktischen und morphologischen Realisierungen zwischen verschiedenen Sprachen in den Griff zu bekommen. $\'{A}gel(1993, 2000)$ nimmt in Anlehnung an $L\'{a}szlo(l988)$ zwei Realisierungsebenen der Valenz, die Mikroebene(=die der morphologischen Aktanten) und die Makroebene(=die der syntaktischen Aktanten) an. Der $Tr\"{a}ger$ auf Mikroebene ist der Mikroaktant, also der Teil des Verbflexivs, der $Tr\"{a}ger$ auf Makroebene ist der Makroaktant, also das syntaktische Subjekt. Die Begriffe 'Mikroebene' und 'Makroebene' werden sowohl statisch und als auch dynamisch interpretiert. Auf Grund dieser Begriffe versucht $\'{A}gel(1993, 2000)$, nach Parallelen der Valenzrealisierung in S und NP zu suchen. Aber die Untersuchung der $Valenzrealisierungsverh\"{a}ltnisse$ in der NP wird zu einem scheinbaren typologischen Gegensatz zwischen S und NP $f\"{u}hren$. Um diesen Gegensatz $aufzul\"{o}sen$, wird das Konzept 'finites Substantiv' $eingef\"{u}hrt$, das analog zum Konzept 'finites Verb' ist. Dabei wird die sog. starke Adjektivflexion in einen Teil der Substantivflexion uminterpretiert. Die GB-Theorie definiert sich als eine Theorie der sog. mentalen Grammatik, des $Sprachverm\"{o}gens$. Da als der Gegenstand der DG die sog. objektive Grammatik angesehen werden kann, scheint der grundlegende Unterschied zwischen den $Gegenst\"{a}nden$ beider Theorien in der Opposition 'intem(=mental vs. extern (=objektiv)' zu liegen. Da die GB eine 'naturwissenschaftlicher' organisierte Theorie ist als die empirische Richtung der DG, ware eine Vergleichsgrundlage in der Tat nicht einfach zu etablieren. Obwohl die beiden Theorien von $v\"{o}llig$ anderen Voraussetzungen und Zielsetzungen ausgehen, gibt es zwischen der DG und der GB $\"{U}berlappungen$ und zunehmende $Ann\"{a}herungen$. Generell ist es notwendig, dass Teileinsichten aus einer Theorie in eine andere Theorie $\"{u}bernommen$ werden. In diesem Aufsatz konnten wir durch die Untersuchung der Korrelation von beiden Theorien partielle Konvergenzen erkennen. Nach Engel(l994) gibt es keine Grammatik 'an sich', sie wird von Grammatikern gemacht. Grammatiken sind Menschenwerk und Linguistenwerk. Wir sind auf der Suche nach 'einer besseren Grammatik.'

  • PDF