Карта сайта

Это автоматически сохраненная страница от 07.12.2017. Оригинал был здесь: http://2ch.hk/b/res/166455253.html
Сайт a2ch.ru не связан с авторами и содержимым страницы
жалоба / abuse: admin@a2ch.ru

Чтв 07 Дек 2017 00:45:57
Няши, я знаю, здесь есть погромисты. Есть большие
Няши, я знаю, здесь есть погромисты.  Есть большие
Няши, я знаю, здесь есть погромисты.
Есть большие объемы текста. Надо анализировать их на наличие ключевых фраз (тегов), и расставить эти теги на каждый абзац\отрывок.
То есть если в абзаце говорится о компьютерах, то ему следует повесить тег "IT", "компьютер".
Возможно уже есть такой инструмент\фреймворк\библиотека?



Чтв 07 Дек 2017 00:46:58
Самому ничего умнее "переберать все слова по списку" не прихдит, но понимаю, что это аутизм.

Чтв 07 Дек 2017 00:47:47



Чтв 07 Дек 2017 00:48:23



Чтв 07 Дек 2017 00:49:01



Чтв 07 Дек 2017 00:49:23



Чтв 07 Дек 2017 00:49:39



Чтв 07 Дек 2017 00:50:40



Чтв 07 Дек 2017 00:51:42
А, вспомнил еще вариант. Видел у гугла сервис по анализу текста, картинок и тд, но он платный.

Чтв 07 Дек 2017 00:52:36
Собственно вот он. Есть смысл использовать?
https://cloud.google.com/natural-language/

Чтв 07 Дек 2017 00:53:47
Так, попробовал и понял что смысла нет. Русский он не поддерживает.

Чтв 07 Дек 2017 00:53:56
[email: sage]

Напиши простенькую библиотеку на Джаве, подключи и скомпилируй. Изи же. Там работы на 200 строчек максимум

Чтв 07 Дек 2017 00:55:02
>>166455619
Какой-то ты ебанутый. Как я напишу библиотеку если не знаю как ей следует работать?

Чтв 07 Дек 2017 00:57:27
>>166455672
пока не дошёл до символ абзаца строки, запоминай самое повторяющееся слово, обнуляй и снова, пока не конец
на петоне минут за 5 реально написать, вот только смысл абзаца не всегда кроется в самых повторяемых словах, так что вряд ли тебе подойдет

Чтв 07 Дек 2017 01:00:00
>>166455253 (OP)
Любой проггер-первокурс напишет такую прогу тебе. Тупо берем, вводим в консоль ввода/инпут.файл, нужный текст и теги, прога перегоняет текст в строку (массив символов), а затем начинает идти от начала до конца текста, сравнивая слова с тегами и вставляя эти теги туда, где эти самые слова будут находиться

Чтв 07 Дек 2017 01:04:12
>>166455925
Или теги надо не самому вводить? Тогда просто по самому часто повторяющемуся слову в строкея выносить его в тег этой строки. Ток я хз, как обозначать переход на новую строку. Вот обычный текст если с вики скопипастить, ручками неудобно будет вставлять символы перехода на строку, там, где они были в оригинальном тексте

Чтв 07 Дек 2017 01:04:14
>>166455798
Вот именно, что далеко не всегда.
Вот например шапка рандомного треда с нулевой:
> Этот пузырь лопнет или нет? Сколько это будет длиться? Кто за этим стоит? Кому это нужно?
О чем этот тред? Не понятно. Каждое слово (кроме знака вопроса) употребляется один раз.
>>166455925
Такую хуету и я могу написать за 5 минут. Что толку то? Представляешь с какой скоростью все это будет работать? Пускай в среднем предложении 10 слов, в абзаце 10 предложений. Это 100 слов. Тегов может быть дикое количество, пускай 1000. Это уже 100000 проверок. А всякие окончания, неверно написаные слова, и прочее?

Чтв 07 Дек 2017 01:06:51
Я тут параллельно нашел библиотеку которая вроде как вытаскиевает смысл из предложений. Делает токены, которые те же теги. Надо попробовать....
http://balie.sourceforge.net
>>166456121
Как уже было сказано, самое повторяющее слово не всегда ключевое. Но теги из массива, да.

Чтв 07 Дек 2017 01:08:42
>>166455253 (OP)
Тупым шлюхам не помогаем

Чтв 07 Дек 2017 01:09:25
>>166456306
Ну и иди нахуй отсюда, чмо бесполезное. Че сагу то не поставил?

Чтв 07 Дек 2017 01:16:30
Ебать ну ты и хитрожопый фрукт такие проги по тз пронанисты пишут тока если парсить будеш в ручную

Чтв 07 Дек 2017 01:29:03
[email: sage]

ОП, могу написать на питоне за 500р, нужно?

Чтв 07 Дек 2017 01:38:26
Это тупая шлюха тян не помогайте ей

Чтв 07 Дек 2017 03:34:27
[email: sage]

>>166457547
С чего ты так решил? Что ОП - тян?


← К списку тредов