🤖Почему польский и русский нейросети понимают лучше, чем английский?
📚 Учёные из Мэриленда протестировали ИИ-модели и выяснили, что задачки лучше всего писать нейронкам именно на этих языках. Это было удивительно: все думали, что это английский, потому что там самый большой, что очевидно, набор знаний. Одна Википедия на английском — 7 млн, а в русском — 1,5.
Я прочитала статью полностью, поэтому теперь знаю причины и расскажу о них вам:
📚 "Нейронки" пылесосят информацию не только с официальных ресурсов, журналов и изучают не только литературный язык. А сленга и прочего в англоязычном мире больше, чем в русском или польском. И на русском/польском говорят в основном носители в Интернете, а в английском есть всё: от spanglish до сhinglish.
🧣🪟 Славянская грамматика: да, тут ручку "приложили" наши падежи, которые дают больше информации. При фиксированном лимите токенов, ИИшки получают больше семантических данных, чем в английском. Они просто "видят" больше смысла.
🐉 Хуже всего нейронки справляются с задачами на китайском: штука в том, что семантика у иероглифов многозначная и контекстность высокая. А это показывает нам только одно: китайские копираторы, SMM-щики и журналисты могут не волноваться, что ИИ отнимет их работу вскоре.
>>747454 → >Зубрёжка не отменяется, просто вкатуну вроде меня нужны хоть малейшие лазейки, чтобы привыкнуть и упорядочить хаос Меня тут постоянно хуесосят за этот совет, но зубрить БОЛЬШЕ - это ЛЕГЧЕ. Пока ты знаешь три с половиной иероглифа, твой мозг не видит паттерн и для тебя каждая новая крокозября как снежинка, уникальная и неповторимая. А если ты начнешь учить по 10-20 иероглифов В ДЕНЬ, то очень быстро просечешь все семантические и фонетические компоненты, и просто базовые блоки иероглифов. Поэтому даже если retention rate у тебя провалится с таким количеством новых иероглифов, это все равно значительно ускорит процесс изучения в перспективе.
>>747552 >>747557 Во втором тоже наверное пару тыщ будет довольно часто употребимых, просто больше в сочетаниях онли, чэнъюях, именах, названиях растений каких-нибудь.
Вот мне зубрежка, кстати, не зашла. Я прям выгараю и забиваю. Мне кажется самый пиздатый способ это просто практиковать язык и надеяться что оно само как-нибудь запомниться.
Типа читаешь, переписываешься, смотришь красную книжку, пишешь от руки какие-нибудь мысли или тексты. Я например так пишу краткие содержания текстов которые читал. Ну и типа... если не знаю как читать иероглиф то смотрю. Если не знаю как писать, прописываю чуть-чуть, потом пишу.
>>747710 Надо просто зубрить с контекстом если это можно назвать зубрежкой в таком случае. Если добавить контекст к карточкам можно намертво слово запомнить за 2-3 повторения всего. У меня карточки были - на лицевой стороне прямо предложение с выделенным цветом словом. Но главное чтобы encoding хороший был, собсна контекст и бустит его, но иногда нет. >Мне кажется самый пиздатый способ это просто практиковать язык и надеяться что оно само как-нибудь запомниться. Это очень неэффективный метод, так норм только на самом начальном этапе, когда ты учишь очень частые слова. Либо если у тебя изучение языка это какая-то самоцель и тебе норм бесконечно с этим возиться.
Говорю ж, повальное неосиляторство карточек. Просто какие-то базовые вещи об обучении люди не понимают.
Ну, я читаю тексты выше своего уровня комфорта и для меня сам текст это одна большая карточка с кучей контекста. Причем с аудио тоже. Так что я хз.
> можно намертво слово запомнить за 2-3 повторения всего
Пользовался готовыми анки колодами. Появлялась проблема того что я не сдвигаюсь по карточкам. Ну типа... я часто забываю, и они уходят в повтор. В итоге больше 50 минут занимает дрочка анок в день. Ну я новое и не добавляю пока старое не уйдёт в подальше.
Ну и так неделю в лимбе и сижу, иногда две. Это пиздец выводит и я бросаю вообще
>>747718 >Ну, я читаю тексты выше своего уровня комфорта и для меня сам текст это одна большая карточка с кучей контекста. Причем с аудио тоже. Так что я хз. Суть карточек в том что это максимальная эффективность с минимальными затратами времени. В какой-то момент в естественной среде слова встречаются реже чем нужно для запоминания. Тогда ты можешь либо дополнительно работать с текстом, = искусственно повысить частотность слова (писать краткие содержания, как ты сказал, или перечитывать целые главы как долбоеб из утонувшего треда), что занимает много времени и не целевая активность. Либо можно подобавлять слова в Анки и продолжить заниматься целевой активностью. Возможно создалось впечатления что я агитирую за карточки онли, без чтения. Это совсем не так. Карточки позволяют читать больше и более сложное раньше, и быстрее сократить потребность в словаре. 15 минут ты повторяешь слова, остальное время ты читаешь. >Пользовался готовыми анки колодами. Ну это понятно не очень. >я часто забываю, и они уходят в повтор. Плохой энкодинг. По простому - ты пытаешься повторять то, что не учил. Если бы ты добавил слово которое встретил в тексте, то это считай уже выучил, осталось повторить пару раз. А так как у тебя готовая колода, то нужно больше времени вложить в изначальное запоминание, а готовые карточки еще и создают иллюзию, что надо просто прочитать, кликнуть некст и оно там должно как-то само запомниться.
У кого есть нэйтив под боком, можете помочь проверить, если произнести фразу 抽着烟 в гугл транслейт, распознает ли он её всегда правильно? Попыток пять сделать там. У меня есть смутные сомнение, что он все-таки больше на частотность ориентируется и для тренировки произношения не очень. У меня конкретно с максимально одинаковым произношением выдал вот эти варианты в перемешку: 抽着烟 抽脂烟 就这样 лол? Может у меня произношение просто такое хуевое, но хотелось бы уточнить, вдруг проблема в гугле.
>>747725 >вдруг проблема в гугле. Нет с ним норм все. Он распознает китайскую речь с точностью 99% Если он не может понять, что ты сказал значит у тебя хуевое произношение
>>747736 Но это же не совсем именно речь, а рандомный кусок фразы, которую никто не скажет снихуя. У меня например гугл клава и по-русски не всегда распознает если я пытаюсь сказать что-то слишком нестандартное.
>>747737 Ну давай посмотрим, если ты скажешь, допустим, 时间 или 倚天, он их распознает? да Можешь попробовать с русским. Это тоже работает. Ну и для китайцев так же. тесть говорит на петуххуа ужасным акцентом, его тоже не распознают. Не парься. Если не доверяешь Гуглу, закажи себе колонку сяоду и с ней треплись.
Гребная обезьяна это не long wipes symbols Гребная обезьяна это не long wipes symbols Гребная обезьяна это не long wipes symbols Гребная обезьяна это не long wipes symbols
8 месяцев каждодневной дрочки и я достиг уровня читать фанфики по наруто. Конечно в каждом предложение мне надо смотреть слово, а иногда в одном предложения 2 слова, а иногда я даже могу прочитать абзац без новых слов. Но блин. Это уже можно назвать чтением. Когда я условную главу прочитываю за 20 минут, а на англе бы читал 13 минут, а не как раньше. Глава 13 минут на англе, а на ките весь час с хвостиком.
>>747722 >Если бы ты добавил слово которое встретил в тексте, то это считай уже выучил, осталось повторить пару раз. Вот такой подход уважаю, а то я думал, ты тот самый анки-наркоман из прошлых тредов.
Эх, когда уже тофулерн оживет и я снова буду дрочить свои списки карточек с написанием.
Аноны, у кого-нибудь есть архивы с китайскими вебновеллами и книгами? Хочу что-нибудь скачать и держать на диске. А то иногда интернет колбасит, хрен что скачаешь, когда нужно.
>>747533 (OP) Есть ли способ различать когда это огонь-курица, а когда индейка? Вопрос не конкретно про этот случай, а в целом. Я увидел 火鸡面 ну и думаю 火鸡 - индейка, видимо лапша с индейкой, а тут это булдак. Есть какой-то способ знать что те слова что ты знаешь тут неприменимы и 面 разобрал индейку на огонь и курицу? Или тупо зубрёжка без шансов?
>>748307 Ловите у кого есть аккаунт. https://tieba.baidu.com/p/9721789092# У меня жена скачает, у нее акк есть. Только потом куда это все отсылать. Рутрекер? Но там иногда за каждый чих могут душу вытрясти.
>>748308 Это калька с корейского (bul + dalk). Здесь нечего "зубрить", это просто бренд.
Звучит как "я увидел кока-колу, ну и думаю, видимо, там должен быть кокаин, а там просто сахар; ну и как узнать, где есть настоящий кокаин, или тут тупо зубрёжка без шансов?".
>>747781 Жена попросила меня проверить меня на настоящем романе для серьезных мужчин. И назвала меня четвероклашкей по результатам чтения нескольких страниц.
>>748412 В китайском есть как в японском свой базовый набор в 2к? Берешь его и учишь по 10 в день. Они там должны быть разделены от простых и частотных к менее употребимым и более сложным.
Поцоны, помогите разобраться с HSK. Вот нашел на сайте СПБГУ https://testingcenter.spbu.ru/ru/ekzameny/hsk.html. Почему тут указаны нормативы HSK 2.0? В России можно только по стандартам HSK 2.0 сдать? Я что-то не понимаю?
Аноны, то ли я тупой или шапка говно - у китайцев же куча диалектов всяких, какой конкретно китайский все эти гайды дают? Вот поехал я в Шанхай, что учить нужно? Насколько я понял - путунхуа, но опять таки сбивают с толку всякие мнения в интернетах.
Чет в последнее время много залетышей стало, которые учат китайский/японский/корейский. Овер дофига языковых курсов пооткрывали. Вы там охуели? Теперь эти языки тоже будут ассоциациироваться с быдлом.
>>748560 Чел, быдло отсеется на тонах/первой сотне ханьцзы. В японском и корейском за счет "простой" каны/хангыля могут попастись подольше, но в итоге один хуй отвалятся.
>>748600 >Как будто в этом нет смысла. 你是完全对的 >Слишком низкий уровень, куда может пригодиться такой сертификат? Ну если вдруг закончится туалетная бумага, ты знаешь, что делать
>>748600 Вообще не понимаю суть этой градации, первые два чискейка же бессмысленны, вот у меня едва третий и я нихую не панимат будучи в китае, я могу только спросить где посрать и где метро и то не пойму ответ в половине случаев.
Как учить иероглифы. В тексте вспоминаю их или при печати на компе чере пиньинь, но самому воспроизвести на бумажке просто нереально. Каждый, почти каждый иероглиф прописывал. Но все вылетает из головы, могу написать только самые базовые.
>>748616 В тексте это проверка запоминания по внешнему виду, а надо еще из головы повторять. К примеру учишь 10 штук в день.Взял 10 штук, запомнил из каких ключей они состоят, назвал по памяти все 10 по типу мир(和) - колос + рот, и так учишь в течении дня пока все 10 не повторишь по русскому значению, не назовешь их составные радикалы. Утром проснулся, повторил.
>>748687 Нахуй ты с сажей пишешь, олух? На твой вопрос сложно ответить? Что ты подразумеваешь под "ебошить"? Может ты в это время будешь просто на текст смотреть с тупым лицом или смотреть фильм с субтитрами? Старый хск 4 или новый? Если старый при условии, что ты знал японский, то можно и за 3 месяца. Если ты не учил до этого восточные языки, думаю тебе даже на старый годик нужен будет. И то не факт, с твоими 1-2 часа надо наверное два года фигачить будет. Сам подумай надо читать, это уже 1 час, учить иероглифы 1 час, учить слова +1, аудирование +1, говорить +1, тренироваться писать +1. Это в идеале на день. С твоими 2 часами не катит.
>>748724 >Говорю, пишу криво косо, но меня жена понимает. Так он хочет сдать HSK, там говорение и письмо, как я понимаю, если завалены тоны можно даже не пытаться сдавать. Видел на каком-то канале разбор от китайских преподав, они говорили, что на говорении смотрят, кроме произношения, на интонацию и логические ударения, типа это показывает осознанность речи. С такими-то кретериями хз кто вообще может его сдать. Видимо братушки всеми силами отсеивают иностранцев. Приплюсуй к этому письмо, где оценивается правильное словоупотребление. Грамматика понятно - ее нет, но вот дохульен синонимов с оттенками смыслов это пизда. У японяк гораздо проще экзамен, там нет говорения и письма. мимо такой же кстати у китайцев есть свой hsk, с разными уровнями, моя жена сдала уровень который позволяет работать учителем не кроме китайского, т.к. южный акцент. Для всяких дикторов ещё жёстче требования. И это все китайцы. Но тот же директор хуавэй пиздит с жёстким гуйчжоуским акцентом и всем пофиг
>>748687 > за сколько, с нуля, можно подготовится к HSK4? 6 месяцев хватит если по 1-2 часа в день ебошить? Если тупо по 1-2 часа в день, то может и не хватить времени, если плюс к этому еще контент начнешь потреблять на китайском, то вполне. >>748725 > кроме произношения, на интонацию и логические ударения, типа это показывает осознанность речи Это сильно виляет только на HSK6. На 3 4 5 сильно не запариваются. Если бы все было так страшно как ты говоришь, то хск4 единицы сдавали бы. А там десятки тысячи студентов со всего мира сдают, и этот уровень считается достаточным для обучения на фул китайском. Так что не пизди тут, чепуха, если не знаешь.
>>748846 Англ не критичен, просто русских источников меньше и они почти все с уклоном в сухой академизм, тебе самому жопу порвет заниматься по какому-нибудь Кондрашенко. Есть еще вариант пользоваться переводными учебниками типа НПККЯ, но там бывает страдает качество перевода или есть не все тома или только старое издание.
>>748846 Английский не критичен, ведь есть boya chinese на русском языке с хорошим переводом и нормальными текстами, да еще и с доп материалами именно для русскоязычных. Есть другие переводные учебники. Ну и на крайняк есть Кондрашевский с не самой актуальной лексикой но разжеванной грамматикой, ну и какой-нибудь Ивченко тоже не плох. Ну и твоего английского тебе хватит для учебников. Что не поймешь в интернете уточнишь.
Это правда что если едешь в Китай учиться/работать тебе надо брать китайское имя? Как это вообще выглядит, у тебя в документах оба имени указывается? Как вообще придумывается китайское имя? Какое имя брать если я Александр, например.
>>749525 А в чем проблема взять тогда любой дефолтный учебник? Там такие же упражнения на грамматику. В новом практическом курсе китайского, насколько я помню, объяснения продублированы на китайском
Полистал первые уроки учебника Кондрашевского, не понял претензий к этому пособию. Довольно актуальная лексика, объясняется все верно, почему так горит у людей от него? Типа не баренское?
Есть тут аноны учащие после японского? Как вам? Интерференция есть? У меня иногда путаются слова хочу сказать きぼう, а получается xiwang приходится немного задумываться. Сеймы есть?
Затем мы были в Ухани две недели, поначалу мне нихрена не понравилось, я понял, что байки про разных китайцев не байки. В гуйяне на нас особо не таращились, и в принципе все понимали мое произношение, вообще ни каких проблем. Может люди и бедные, но нет попрошаек, все работают, ещё вкусная жрачка и на улице никто не сплевывает. Очень вежливые люди. Прям Япония. У меня есть теория почему так получилось, в Гуйчжоу в основном люди сами не приезжали, туда либо бежали бандиты, или людей ссылали. Вот, видимо там была японский или если угодно лагерный менталитет, косо посмотришь тебе пизда. Поэтому люди очень любят правила. И нет жирдяев. Видимо они в дороге погибали. Поэтому в основном все худые, жилистые и высокие. Например ее дядя 185, против моих 182. И что не мало важно прохладный климат Теперь Ухань, сука там сыро шо пиздец ещё и жара в сентябре была 30 градусов. Люди харкают на улицах, одна треть толстые. Пялятся постоянно. Говоришь на китайском отвечают по английски.вот. но если привыкнуть и гулять в центре, то с пивом сойдёт. Музей революции хороший был.
>>749800 Да обезьяна чудит. Ты просто русский добавляй. На фочане кстати такой фигни нет. Я там как то с одним англикосом поздел на китайском, прикольный чувак, книжек насоветовал.
>>750080 У тебя самого наверное есть что нибудь такое. Делись. Хоть тред оживет. Я смотрю иногда аниму или фильмы и типа мысленно стараюсь перевести на китайский. Если не знаю слово выписываю типа 叛徒 предатель 裏切り者 пока берсерка смотрел
>>750083 Я вообще ньюфаг, у меня каждый день десяток новых слов, зачастую тех же самых что и несколькими днями ранее. Я не на той стадии, чтобы выделять что-то чем мог бы поделиться.
>>750087 Тогда держи вот это. https://kitchenknif.github.io/SlowChinese/ Бля добавте эту херь в шапку. Я заколебался ее кидать. Там 200 подкастов, быстрым и медленным языком с транскрипцией. Наслаждайтесь.