Articles of regex

Regex combina parte de um subgrupo opcional

Estou tentando pegar vários events de um site. Os events têm um formato regular de … EVENT TITLE & LINK … START DATE … END DATE … LOCATION … onde “…” são algumas tags html com informações de estilo e novas linhas. Eu quero extrair LINK, START DATE, END DATE e LOCATION a partir dessas […]

Como escrever regex para encontrar um diretório em um URL?

Aqui está o assunto: http://www.mysite.com/files/get/937IPiztQG/the-blah-blah-text-i-dont-need.mov O que eu preciso usar regex é apenas o bit antes do último / (incluindo o último / também) A seqüência 937IPiztQG pode mudar; ele conterá az AZ 0-9 – _ Aqui está o que eu tentei: $code = strstr($url, ‘/http:\/\/www\.mysite\.com\/files\/get\/([A-Za-z0-9]+)./’); EDITAR: preciso usar o regex porque na verdade não […]

Xpath Regex no PHP não funciona

Aqui está o meu XML que é retornado: 6791 0 0 49211 0 B00H2Y2UY6 2 57741 0 2 57751 0 2 57761 eu queria obter o nó de list->item[0-9] que é anexado com um número que estou usando a class SimpleXMLElement do PHP para obtê-los, mas não consigo obter o nó com expressão regular aqui […]

Obter o nome do arquivo do caminho e converter sublinhados em espaços

Eu tenho uma série de arquivos de imagem com caminhos relativos, como este: gallery/painting/some_image_name.jpg . Eu estou passando essa matriz para um loop foreach que imprime o caminho na fonte de um . O que é uma maneira segura e confiável de puxar o nome de uma linha como essa? gallery/painting/some_image_name.jpg > para> algum nome […]

Converta o link de texto para HTML com o contexto considerado

Eu quero converter links como http://google.com/ para HTML, no entanto, se eles já estiverem em um link HTML, na href = “” ou no texto do link, eu não quero converta-os. Achei isso em outra questão: preg_replace(‘@(https?:\/\/([-\w\.]+[-\w])+(:\d+)?(/([\w/_\.#-]*(\?\S+)?[^\.\s])?)?)@’, ‘https://stackoverflow.com/questions/7129283/convert-text-link-to-html-with-context-considered/$1’, $text); No entanto, se eu tiver algo como: http://google.com/ já no texto de destino em questão, ele […]

Combine todo o texto entre duas tags HTML usando um regex em PHP

Eu tenho um problema com um padrão regex. Ele retorna dois arrays como resultado … Aqui está o meu código: $code = preg_match_all(“/\(.*?)\/”,$code,$matches); var_dump($matches); Como teste, eu configurei: $code = “> try blah fooo blah idfidf oh blah blah blah style1 blah blah style 2 x Retorna 2 arrays, quero dizer $matches = array 0 […]

Preg replace por letras de acento

Estou tentando inserir um intervalo após um nome em uma string. Mas, o nome pode ter personagens como é $string = ‘Test string’; $name = ‘Tést’; $replacement = ‘$0$1’; return preg_replace(“/^$name/i”, $replacement, $string); Eu gostaria que isso voltasse: Test string Tampouco poderia ser algo como: Héllo, byé ou nùl Isso deveria ser possível? desde já, […]

Converta todas as tags HTML em minúsculas

Eu tenho esse código, mas o PHP me dá um Unknown modifier ‘?’ erro. Alguém sabe o que fiz de errado? (Eu encontrei o código na internet, porque não estou familiarizado com a regex) $old = “”; $newString = preg_replace(“/</?\w+/e/", "strtolower('\\0')", $old); echo $newString ."”;

Substitua todas as URLs em seqüências de caracteres que não correspondem ao padrão de url no php

Estou usando o seguinte código para filtrar URLs a partir de um bloco de texto HTML em PHP. preg_replace(‘#]+?href=”?http://keepthisdomain.com/foo/bar”?).*?>(.*?)#i’, ‘\1’, $text); Ele destina-se a replace todos os URLs que não correspondem ao padrão de url especificado. No entanto, eu quero include todas as tags que tenham o atributo rel = conjunto “shadowbox [a]”. Como posso […]

Raspe o conteúdo div usando PHP e CURL

Eu sou novo no CURL. Estive tentando esvaziar o conteúdo deste link amazônico (ou seja, imagem, título do livro, autor e preço dos 20 livros) em uma página html. Até agora eu tenho que imprimir a página usando o código abaixo TRUE, CURLOPT_FOLLOWLOCATION => TRUE, CURLOPT_AUTOREFERER => TRUE, CURLOPT_CONNECTTIMEOUT => 120, CURLOPT_TIMEOUT => 120, CURLOPT_MAXREDIRS […]