Ученые из РФ создали нейросеть, которая по содержанию и оформлению постов в социальных сетях может отличать грамотных людей от тех, кто плохо учился в школе. Отличники вставляют иностранные слова, а двоечники - смайлы. Российские ученые представили алгоритм, умеющий анализировать сообщения в соцсетях и определять, кто их написал – отличник или двоечник. Специалисты утверждают, что точность составляет 94%, пишет EPJ Data Science.
Исследователи предоставили для изучения нейросети посты в Twitter и ВКонтакте.
"Наша модель с точностью до 94% выявляла учащихся с высокой и низкой успеваемостью... Такой подход может быть полезен и для выявления депрессии, влияющей на учебные достижения", - заявил автор работы, заведующий лабораторией вычислительных социальных наук Института образования НИУ ВШЭ Иван Смирнов.
Ученый и его коллеги собрали и изучили сообщения, которые на своих страницах в ВКонтакте написали примерно 2,4 тысячи подростков, проходивших в 2012 году специальный тест на оценку грамотности и способности применять знания на практике.
Материал был предоставлен для тренировки нейросетям, которые проанализировали смысловое содержание и стилистику сообщений и сопоставили их с типичным уровнем образования и успеваемости людей, для которых характерны подобные интересы, знания и стиль написания.
В итоге нейросеть научилась довольно точно определять двоечников и отличников.
Отмечается, что отличникам характерны длинные тексты, связанные с литературой, физикой и описанием мыслительных процессов. Их сообщения богаты лексиконом и в них присутствуют иностранные слова.
А вот двоечники "удобряли" свои тексты в основном смайлами и словами, написанными заглавными буквами. Также эта категория пользователей сети чаще всего обсуждала гороскопы, ДТП и службу в армии.
"Наши результаты показали, насколько уязвима конфиденциальность пользователя в социальной сети. Люди переживают из-за вездесущих камер и систем распознавания лиц, однако, даже /…/ короткий текст, может стать источником информации, которую человек не собирался раскрывать", - резюмировали специалисты.
>>8523218 (OP) >Отличники вставляют иностранные слова, а двоечники - смайлы. Nixelpixel будет звучать очень smart за обильное использование английских words про хуйню, малафию и abuse
НАЗЫВАЙТЕ ПО РУССКИ - ГОВНОБОТ. МЕНЯ ВЧЕРА ТАКОЙ ГОВНОБОТ В ВК ФЕЙК ЗАБАНИЛ ЗА ФРАЗУ - ЗАСТРЕЛИСЬ ЛУЧШЕ- ОН ВОСПРИНЯЛ ЭТО КАК ПРИЗЫВ К СУИЦИДУ
>Отличники вставляют иностранные слова
А ТУТ Я ВАЩЕ КРИНЖ С ЭТИХ БУМИРОВ СЛОВИЛ ЧЕ ЗА ПИЗДЕЦ ЛОЛ - ДАВАЙТЕ ЕЩЕ БОТА НАТАСКАЕМ ТАК ЧТОБЫ НИКСЕЛЬ ПИКСЕЛЬ СТАЛА САМОЙ ГРАМОТНОЙ РОССИЯНКОЙ - РОЗЕНТАЛЬ И ДАЛЬ ОТДЫХАЮТ ЭТОГО БОТА В ВШЭ СОСТАВЛЯЛИ ЧТОЛИ ЧТО ЗА ХУЙНЮ Я ЧИТАЮ
>>8523294 А У ПРОГРАММИСТОВ ОТКУДА РУНГЛИШ ЛОЛ - ВСЯ ТЕРМИНОЛОГИЯ ЕЩЕ ПРИ СОВЕТСКОМ СОЮЗЕ ПЕРЕВЕДЕНА И АДАПТИРОВАНА ПОД РУССКИЙ - КАКИЕ ТАМ НАХУЙ МОГУТ БЫТЬ АНГЛИЙСКИЕ ТЕРМИНЫ?
>>8523218 (OP) >Отличники вставляют иностранные слова >Их сообщения богаты лексиконом и в них присутствуют иностранные слова. >А вот двоечники "удобряли" свои тексты в основном смайлами и словами, написанными заглавными буквами @ >заявил автор из ВШЭ
Тот неловкий момент, когда ВШИ утверджают, что это: >тупая хуемразь, хавтить меня абьюзить и фетшеймить, мой сасный краш бы тебе показал хау мач ю пидор! умнее, чем это: >С чего это я должен воспринимать тебя и твой обоссаный бред, тупая ты пизда, если всё, что ты делаешь, это сыплешь на меня словами позаумнее, разбавленные иностранными словами просто для того, чтобы казаться умнее? У тебя вообще есть мозги? Ты вообще способна выражать мысли словами? Правильно на дваче пишут - ВШЭй гони взашей. Какие же ВШИ мрази
>>8523218 (OP) Интересно откуда они брали данные об успеваемости. Если по опросам самих испытуемых, то они так скорее проверили что вставляющие иностранные слова - вычурные петухи которые хотят показаться лучше чем они есть.
>>8523218 (OP) Кто вообще в 2020 вставляет смайлы? Негры? Зумеры вставляют транслит англюсечных слов из пубга, но если я начну изьясняться терминами файтинг-игр, то вы вообще ни слова не поймете.
>НАЗЫВАЙТЕ ПО РУССКИ - ГОВНОБОТ. >МЕНЯ ВЧЕРА ТАКОЙ ГОВНОБОТ В ВК ФЕЙК ЗАБАНИЛ ЗА ФРАЗУ - ЗАСТРЕЛИСЬ ЛУЧШЕ- ОН ВОСПРИНЯЛ ЭТО КАК ПРИЗЫВ К СУИЦИДУ >А ТУТ Я ВАЩЕ КРИНЖ С ЭТИХ БУМИРОВ СЛОВИЛ >ЧЕ ЗА ПИЗДЕЦ ЛОЛ - ДАВАЙТЕ ЕЩЕ БОТА НАТАСКАЕМ ТАК ЧТОБЫ НИКСЕЛЬ ПИКСЕЛЬ СТАЛА САМОЙ ГРАМОТНОЙ РОССИЯНКОЙ - РОЗЕНТАЛЬ И ДАЛЬ ОТДЫХАЮТ >ЭТОГО БОТА В ВШЭ СОСТАВЛЯЛИ ЧТОЛИ ЧТО ЗА ХУЙНЮ Я ЧИТАЮ >А У ПРОГРАММИСТОВ ОТКУДА РУНГЛИШ ЛОЛ - ВСЯ ТЕРМИНОЛОГИЯ ЕЩЕ ПРИ СОВЕТСКОМ СОЮЗЕ ПЕРЕВЕДЕНА И АДАПТИРОВАНА ПОД РУССКИЙ - КАКИЕ ТАМ НАХУЙ МОГУТ БЫТЬ АНГЛИЙСКИЕ ТЕРМИНЫ?
>А вот двоечники "удобряли" свои тексты в основном смайлами и словами, написанными заглавными буквами.
На всеросcuйckuй dickтант, двоеchnik. Пиздец, с who я сижу на same board
— Почему, мистер тян, почему? Во имя чего? Что вы делаете? Зачем, зачем вы упорствуете? Зачем продолжаете использовать эмоджи? Неужели вы верите в какую-то эмоциональность картинок, или вам просто страшно писать сухим текстом? Так в чем же смысл этого, может быть, вы откроете? Это даунизм, эмоции, может быть, мода, или вы боретесь за отупение интернета? Иллюзии, мистер тян, причуды восприятия. Хрупкие логические теории слабого человека, который отчаянно пытается разбавить эмоциями свой текст — бесцельный и бессмысленный! Но он, мистер тян, как и эмоджи, столь же несуразен и туп. Только сельдь может выдумать скучное и безжизненное явлениепонятие — «эмоджи»! Вам пора это увидеть, мистер тян, увидеть и понять! Вы не можете победить, продолжать использовать эмоджи бессмысленно. Почему, мистер тян, почему вы упорствуете? — Потому что это моя лишняя хромосома.
>>8523578 Вышкинцы считают, что это: >Когда напишешь свою первую имиджборду, по пути изучив верстку на html+css, скачиваешь и изучаешь любой питоний асинхронный вебсервер, рекомендую Tornado или Gevent. Как переделаешь имиджборду, чтобы выдавала по крайней мере 5 тысяч запросов в секунду, можешь идти дальше - тебя ждет увлекательный мир хайлоада.
Умнее, чем это: >Ну давай разберем по частям, тобою написанное )) Складывается впечатление что ты реально контуженный , обиженный жизнью имбицил )) Могу тебе и в глаза сказать, готов приехать послушать?) Вся та хуйня тобою написанное это простое пиздабольство , рембо ты комнатный)) от того что ты много написал, жизнь твоя лучше не станет)) пиздеть не мешки ворочить, много вас таких по весне оттаяло )) Про таких как ты говорят: Мама не хотела, папа не старался) Вникай в моё послание тебе постарайся проанализировать и сделать выводы для себя)
Смысл не в том, что если ты сыпешь англицизмами, слова автоматически становятся правдой. А в том, что если ты говоришь складно, без мата и смайлов, и периодически вставляешь адекватные иноязычные термины, ты умный.
>>8523850 А меня ебёт, потому что ты пишешь мне, и мне приходится читать твой малограмотный понос, уёбок тупой. Я, блять, автор фразы, хули ты со мной про её контекст споришь? Пошёл нахуй.
>>8523847 С какого перепугу это: >Ну давай разберем по частям, тобою написанное )) Складывается впечатление что ты реально контуженный , обиженный жизнью имбицил )) Могу тебе и в глаза сказать, готов приехать послушать?) Вся та хуйня тобою написанное это простое пиздабольство , рембо ты комнатный)) от того что ты много написал, жизнь твоя лучше не станет)) пиздеть не мешки ворочить, много вас таких по весне оттаяло )) Про таких как ты говорят: Мама не хотела, папа не старался) Вникай в моё послание тебе постарайся проанализировать и сделать выводы для себя)
Тупее, чем: >Когда напишешь свою первую имиджборду, по пути изучив верстку на html+css, скачиваешь и изучаешь любой питоний асинхронный вебсервер, рекомендую Tornado или Gevent. Как переделаешь имиджборду, чтобы выдавала по крайней мере 5 тысяч запросов в секунду, можешь идти дальше - тебя ждет увлекательный мир хайлоада.
Ведь, чаще всего, эти вещи пишут одни и те же люди. Да и все знают, что веб-макаки тупее, чем просто-макаки. Ведь умная макака не пошла бы в веб-разработку, а дальше жрала бы банан, ведь она знает принцип бритвы Оккама.
>>8523774 Вопрос >>8523826 остается открытым. Есть специалисты, которые могут объяснить смысл дейтвий этих людей. Только без щуток смищных. Мне реально интересно, зачем они спамят эмодзями
>>8523915 >СОКРАЩЕНИЕ ОТ РОБОТ >РОБОТ - СЛАВЯНСКОЕ СЛОВО, ЧЕШСКИЙ ИЛИ ПОЛЬСКИЙ ЯЗЫК - РАБОТАТЬ ТИПА Вообще-то от слова "Робота", что естьв переводе "рабский труд". Сегу отклей, падаль
>>8524007 Пизда, блядь. В чешском через каждое слово германизмы, не говоря уже о польском. И германизмов настолько дохуя, что чешский недавно стал их чистить.
>>8524036 Блять, во-первых, по-немецки труд это "Arbeit". А во-вторых, как слово, означающее "труд" в чешском может быть германизмом, если это: А-базовая основа языка, Б-вообще не похоже на "Arbeit"
>>8524227 на педовики >>8524173 Как бы, Срусь была под игом скандинавов, еще в древнем новгородском диалекте прослеживаются заимствования из скандинавских языков
>>8524246 Итого мы приходим к тому, что все трое из нас неправы.
работа >From Proto-Slavicorbota, from orbъ (“slave”) + -ota.
orbъ >From Proto-Indo-Europeanh₃órbʰos (“orphan”). According to the majority view, cognate with Ancient Greek ὀρφανός (orphanós, “orphaned”), Latin orbus (“orphaned”), Old Armenian որբ (orb, “orphan; orphaned”) and Sanskrit अर्भ (árbha, “child; small”). Per Derksen, probably also cognate with Proto-Germanic arbaidiz.
Итог: Слово таки связано с германским арбайтом, и также шло от странной трансформации орботы в роботу, так как все эти языки вышли из прото-индо-европейского. Но это не германизм ни в случае.
>>8525014 Калик) это постирония. Ирония, которая выглядит не как ирония.
(Вопреки расхожему мнению, что картинка ботинка с подписью "Матвей" лобстером-это постирония, это-не она.Такие картинки это метаирония. Тобишь ирония без иронии, смешное без смешного.)
>>8523218 (OP) Точность 94 % - достойная российских ученых! Интересно, а грамотность испытуемых измерялась по оценкам российских школ или соотносилась с грамотностью российских ученых из российских школ?