| |
| 2.3, аноннн (?), 00:25, 02/07/2019 [^] [^^] [^^^] [ответить]
| +9 +/– | |
ну ка, хотел бы посмотреть на парсер robots в 10 или хотябы в 100 строк кода
обрадуете нас своим изобретением?
| | |
| |
| 3.6, Аноним (6), 08:10, 02/07/2019 [^] [^^] [^^^] [ответить]
| –1 +/– |
Что делается в 10 строк != парсер robots.txt
Он мог и про отдельные функции говорить и вообще с другим языком сравнивать
| | |
|
|
| 1.5, Аноним (5), 07:58, 02/07/2019 [ответить] [﹢﹢﹢] [ · · · ]
| +/– | |
> Библиотека ... учитывает различные нюансы оформления,
Костыли чтоль? )))
| | |
| |
| |
| |
| 4.12, Аноним84701 (ok), 11:38, 02/07/2019 [^] [^^] [^^^] [ответить]
| +5 +/– |
>> Опечатки, например, diasllow
> эксперты опеннета, как всегда. Нет, думать за вас и исправлять ваши опечатки
> этот парсер не обучен.
Эк вы … самокритичны (впрочем, как обычно):
https://github.com/google/robotstxt/blob/master/robots.cc#L696
bool ParsedRobotsKey::KeyIsDisallow(absl::string_view key) {
return (
absl::StartsWithIgnoreCase(key, "disallow") ||
(kAllowFrequentTypos && ((absl::StartsWithIgnoreCase(key, "dissallow")) ||
(absl::StartsWithIgnoreCase(key, "dissalow")) ||
(absl::StartsWithIgnoreCase(key, "disalow")) ||
(absl::StartsWithIgnoreCase(key, "diasllow")) ||
(absl::StartsWithIgnoreCase(key, "disallaw")))));
| | |
| |
| 5.14, пох. (?), 13:25, 02/07/2019 [^] [^^] [^^^] [ответить]
| –1 +/– | |
о, хренассе, это вот прямо в основном коде.
впрочем, пользы от поделки все равно никакой - https://www.opennet.me/openforum/vsluhforumID3/117784.html#11
(ведь сиплюсплюсики такой низкоуровневый язычок, что для банальной задачи обработки текстового файла из десятка предопределенных строк надо притащить за собой мильен каких-то мусорных гуглоисходников и собирать это все нескучной сборочной системочкой)
| | |
|
|
|
|
| 1.9, бублички (?), 10:45, 02/07/2019 [ответить] [﹢﹢﹢] [ · · · ]
| +2 +/– |
просто бесценный проект - целый индус трудился и больше часа. да и новость тоже революционная. ждём hello world 2
| | |
| |
| 2.16, пох. (?), 13:29, 02/07/2019 [^] [^^] [^^^] [ответить]
| +/– |
ты просто еще зависимости не скачал - там не "целый индус", там вся его бангалорская родня в количестве 3000000 обезьян трудилась.
И еще пяток миллионов китайцев припахала за ними горшки выносить.
| | |
| |
| 3.17, бублички (?), 15:25, 02/07/2019 [^] [^^] [^^^] [ответить]
| +/– |
за 20 лет, карл! ты погляди чего наваляли! поди с нуля переписывали 80 раз (по 4 раза в год)
| | |
| |
| 4.19, пох. (?), 21:45, 02/07/2019 [^] [^^] [^^^] [ответить]
| +/– | |
> поди с нуля переписывали 80 раз (по 4 раза в год)
конечно - ты ради кода в 1,5k строк (работающего банально - со строками) будешь изучать что это за нёх?
absl::StartsWithIgnoreCase() - и т д?
Полагаю, ты просто перепишешь большую часть на чем-то что либо нужно в другой работе, либо просто уже знаешь.
Вот и следующий копчоный то же самое сделает.
| | |
|
|
|
| 1.10, Аноним (10), 11:28, 02/07/2019 [ответить] [﹢﹢﹢] [ · · · ]
| –2 +/– | |
>содержащих правила (REP, Robots Exclusion Protocol) для исключения контента из области индексации ботами поисковых систем
РКН обяжет всех поисковиков к обязательному использованию. А правилами исключения захочет рулить самостоятельно.
| | |
| 1.11, Аноним (11), 11:28, 02/07/2019 [ответить] [﹢﹢﹢] [ · · · ]
| +3 +/– | |
Building the library
Bazel is the official build system for the library
расходимся, ребята - чтобы собрать "библиотеку" из ЦЕЛОГО ОДНОГО файла - как обычно у гугля, нужно себе нескучных зондопрограмм понаставить пару терабайт.
| | |
| |
| 2.18, Аноним (18), 17:37, 02/07/2019 [^] [^^] [^^^] [ответить]
| –2 +/– |
О, эксперты-любители автокрапа подъехали? Его то уж точно не пара терабайт, да?
| | |
|
| 1.13, YetAnotherOnanym (ok), 11:45, 02/07/2019 [ответить] [﹢﹢﹢] [ · · · ]
| +1 +/– |
Осталась мелочь - догадаться, что сам Гугл вовсе не обязательно использует этот парсер в том виде, в каком он опубликован, но уж всяко хочет, чтобы мы верили, что используемый им парсер именно такой.
| | |
| |
| 2.15, пох. (?), 13:27, 02/07/2019 [^] [^^] [^^^] [ответить]
| +/– | |
ты хочешь сказать, что моя строчка с dissalow: / все же не будет им обрабатываться "правильно"?
да ну, не может быть!
| | |
|
|