Update (fix): infinite loop
This commit is contained in:
@@ -23,12 +23,17 @@ public static function handle(int $url_to_crawl_id)
|
||||
return null;
|
||||
}
|
||||
|
||||
if (in_array($url_to_crawl->status, ['blocked', 'trashed'])) {
|
||||
return;
|
||||
}
|
||||
|
||||
$enable_proxy = false;
|
||||
|
||||
$url_to_crawl->is_crawling = true;
|
||||
$url_to_crawl->save();
|
||||
$url_to_crawl->refresh();
|
||||
|
||||
|
||||
// try {
|
||||
$user_agent = config('platform.proxy.user_agent');
|
||||
|
||||
@@ -66,9 +71,13 @@ public static function handle(int $url_to_crawl_id)
|
||||
// //throw $e;
|
||||
// }
|
||||
|
||||
if (! is_empty($raw_html)) {
|
||||
|
||||
$markdown_output = self::getMarkdownFromHtml($raw_html);
|
||||
|
||||
|
||||
if (! is_empty($markdown_output)) {
|
||||
$url_to_crawl->output_type = 'markdown';
|
||||
$url_to_crawl->output = self::getMarkdownFromHtml($raw_html);
|
||||
$url_to_crawl->output = $markdown_output;
|
||||
|
||||
} else {
|
||||
$url_to_crawl->output = 'EMPTY CONTENT';
|
||||
@@ -76,6 +85,7 @@ public static function handle(int $url_to_crawl_id)
|
||||
}
|
||||
|
||||
$url_to_crawl->is_crawled = true;
|
||||
$url_to_crawl->crawl_counts = $url_to_crawl->crawl_counts + 1;
|
||||
|
||||
if ($url_to_crawl->save()) {
|
||||
if (! in_array($url_to_crawl->status, ['blocked', 'trashed'])) {
|
||||
|
||||
Reference in New Issue
Block a user