Jak przekonwertować XML na tablicę w PHP?

166

Chcę przekonwertować poniższą tablicę XML na PHP. Jakieś sugestie, jak mogę to zrobić?

<aaaa Version="1.0">
   <bbb>
     <cccc>
       <dddd Id="id:pass" />
       <eeee name="hearaman" age="24" />
     </cccc>
   </bbb>
</aaaa>
Hearaman
źródło
3
także, w jaki sposób to pytanie różni się od twojego innego pytania? stackoverflow.com/questions/6578084/…
Gordon,
3
Niewiele rzeczy jest tak okropnych, jak PO przyjmujący złą odpowiedź na swoje pytanie.
Jan

Odpowiedzi:

127

Inną opcją jest rozszerzenie SimpleXML (uważam, że jest standardem w większości instalacji php).

http://php.net/manual/en/book.simplexml.php

Na przykład składnia wygląda mniej więcej tak

$xml = new SimpleXMLElement($xmlString);
echo $xml->bbb->cccc->dddd['Id'];
echo $xml->bbb->cccc->eeee['name'];
// or...........
foreach ($xml->bbb->cccc as $element) {
  foreach($element as $key => $val) {
   echo "{$key}: {$val}";
  }
}
Sam Dufel
źródło
82
Szczerze mówiąc, nie jest to dokładna odpowiedź na pytanie, jak uzyskać tablicę.
sieppl
SimpleXML jest do bani podczas analizowania tego XML: amazon.in/rss/bestsellers/shoes?tag=dealslama-21 Nawet print_r nie mówi, że obiekt faktycznie zawiera.
ravisoni
użyj var_dump, zobaczysz strukturę xml jako klucze wewnątrz obiektu.
Magus
3
Mam [CDATA[TEXT]]pewne elementy wewnątrz niektórych elementów i nie są one analizowane z tym. Analizuje go jako plik SimpleXMLElement Object. Jakieś obejście tego problemu?
masterFly
To nie odpowiada na pytanie
Bilaal Rashid
434

łatwo!

$xml = simplexml_load_string($xmlstring, "SimpleXMLElement", LIBXML_NOCDATA);
$json = json_encode($xml);
$array = json_decode($json,TRUE);
user1398287
źródło
20
Możesz napotkać problemy w sekcjach CDATA (zwracając zawsze null). Jako rozwiązanie wypróbuj $ xml = simplexml_load_string ($ xmlstring, null, LIBXML_NOCDATA); $ json = json_encode ($ xml); $ tablica = json_decode ($ json, TRUE); (patrz stackoverflow.com/a/2970701/413531 ) // e cholera ... czy jest sposób na dodanie nowych linii w komentarzu?
Hirnhamster
4
Robimy dokładnie to samo, ale z simplexml_load_file i działa dobrze. Dzięki
Thermech
2
Do czego służy drugi parametr (TRUE)?
Mansour Fahad
3
@MansourFahad W json_decode możesz użyć opcjonalnego drugiego parametru as TRUE(zwykle domyślnie FALSE), aby przekonwertować dane wejściowe JSON na tablicę asocjacyjną.
Jake Bathman
16
@Ismael Miguel za dużo kodu? To, że umieściłeś wszystkie te funkcje w jednym wierszu, nie oznacza, że ​​używasz mniej kodu. Może wyglądać na bardziej zwartą, ale odbywa się to kosztem czytelności.
Jage
43

Przekształcenie ciągu XML ( $buffer) w uproszczoną tablicę z ignorowaniem atrybutów i grupowaniem elementów potomnych o tych samych nazwach:

function XML2Array(SimpleXMLElement $parent)
{
    $array = array();

    foreach ($parent as $name => $element) {
        ($node = & $array[$name])
            && (1 === count($node) ? $node = array($node) : 1)
            && $node = & $node[];

        $node = $element->count() ? XML2Array($element) : trim($element);
    }

    return $array;
}

$xml   = simplexml_load_string($buffer);
$array = XML2Array($xml);
$array = array($xml->getName() => $array);

Wynik:

Array
(
    [aaaa] => Array
        (
            [bbb] => Array
                (
                    [cccc] => Array
                        (
                            [dddd] => 
                            [eeee] => 
                        )

                )

        )

)

Jeśli chcesz mieć również atrybuty, są one dostępne za pośrednictwem kodowania / dekodowania JSON SimpleXMLElement. Często jest to najłatwiejsze, szybkie i brudne rozwiązanie:

$xml   = simplexml_load_string($buffer);
$array = json_decode(json_encode((array) $xml), true);
$array = array($xml->getName() => $array);

Wynik:

Array
(
    [aaaa] => Array
        (
            [@attributes] => Array
                (
                    [Version] => 1.0
                )

            [bbb] => Array
                (
                    [cccc] => Array
                        (
                            [dddd] => Array
                                (
                                    [@attributes] => Array
                                        (
                                            [Id] => id:pass
                                        )

                                )

                            [eeee] => Array
                                (
                                    [@attributes] => Array
                                        (
                                            [name] => hearaman
                                            [age] => 24
                                        )

                                )

                        )

                )

        )

)

Zwróć uwagę, że wszystkie te metody działają tylko w przestrzeni nazw dokumentu XML.

hakre
źródło
W PHP 7 Musiałem dodać to: && (is_countable($node) && 1 === count($node) ? $node = array($node) : 1)jednak mam błąd w następnym wierszu: [] operator not supported for strings.
andreshg112
@ andreshg112: Nie mogę odtworzyć (działa stabilnie PHP 5.3.0 - 7.4.0), zachowanie nie zmieniło się od wieków, proszę porównać z setkami różnych wersji PHP: 3v4l.org/l4nQN
hakre
może to z powodu mojego pliku KML (jest to XML). Nie mogę się tym podzielić. Już go zaimportowałem, ale musiałem zrobić to w inny sposób.
andreshg112
prawdopodobnie obawiasz się przestrzeni nazw XML. Przykład dotyczy tylko części bez przestrzeni nazw (lub domyślnej, czasami ją mieszam).
hakre
24
$array = json_decode(json_encode((array)simplexml_load_string($xml)),true);
Fawad Ghafoor
źródło
1
jeśli rzutujesz na tablicę, nie potrzebujesz json_encodei json_decode.
Ismael Miguel
11
@Ismael w teorii, rzutowanie na tablicę powinno wystarczyć. W praktyce musimy także rzutować wszystkie węzły liści, które również są obiektami. Naiwna obsada pozostawia liście jako obiekty SimpleXML. json_encode rzuca rekurencyjnie, oszczędzając dużo pracy.
Peter Mellett
2
Jeśli nie masz wartości tekstowych w swojej $arrayzmiennej, prawdopodobnie jest to spowodowane CDATA. Aby go rozwiązać, załadować XML z: new SimpleXMLElement($xml, LIBXML_NOCDATA).
Jonathan Petitcolas
1
ps. $ xml = str_replace (array ('<! [CDATA [', ']]>'), '', $ xml);
user956584
1
To tak nie działa. Ten kod nie przekształciłby nawet prostego XML-a, takiego jak ten <?xml version="1.0" encoding="UTF-8"?><note a="b"><body c="d">Hello!</body></note>. Uruchom kod, a zobaczysz, że atrybut <body> c został utracony! Proszę sprawdzić pełny kod tutaj, jeśli nie chcesz żadnych przykrych niespodzianek github.com/gaarf/XML-string-to-PHP-array/blob/master/… lub zobacz moją odpowiedź poniżej stackoverflow.com/a/30234924/828366
Francesco Casula
7

Zobacz https://github.com/gaarf/XML-string-to-PHP-array/blob/master/xmlstr_to_array.php

<?php
/**
  * convert xml string to php array - useful to get a serializable value
  *
  * @param string $xmlstr
  * @return array
  *
  * @author Adrien aka Gaarf & contributors
  * @see http://gaarf.info/2009/08/13/xml-string-to-php-array/
*/
function xmlstr_to_array($xmlstr) {
  $doc = new DOMDocument();
  $doc->loadXML($xmlstr);
  $root = $doc->documentElement;
  $output = domnode_to_array($root);
  $output['@root'] = $root->tagName;
  return $output;
}
function domnode_to_array($node) {
  $output = array();
  switch ($node->nodeType) {
    case XML_CDATA_SECTION_NODE:
    case XML_TEXT_NODE:
      $output = trim($node->textContent);
    break;
    case XML_ELEMENT_NODE:
      for ($i=0, $m=$node->childNodes->length; $i<$m; $i++) {
        $child = $node->childNodes->item($i);
        $v = domnode_to_array($child);
        if(isset($child->tagName)) {
          $t = $child->tagName;
          if(!isset($output[$t])) {
            $output[$t] = array();
          }
          $output[$t][] = $v;
        }
        elseif($v || $v === '0') {
          $output = (string) $v;
        }
      }
      if($node->attributes->length && !is_array($output)) { //Has attributes but isn't an array
        $output = array('@content'=>$output); //Change output into an array.
      }
      if(is_array($output)) {
        if($node->attributes->length) {
          $a = array();
          foreach($node->attributes as $attrName => $attrNode) {
            $a[$attrName] = (string) $attrNode->value;
          }
          $output['@attributes'] = $a;
        }
        foreach ($output as $t => $v) {
          if(is_array($v) && count($v)==1 && $t!='@attributes') {
            $output[$t] = $v[0];
          }
        }
      }
    break;
  }
  return $output;
}
Francesco Casula
źródło
7

Zdziwiony nikt nie wspomniał xml_parse_into_struct:

$simple = "<para><note>simple note</note></para>";
$p = xml_parser_create();
xml_parse_into_struct($p, $simple, $vals, $index);
xml_parser_free($p);
echo "Index array\n";
print_r($index);
echo "\nVals array\n";
print_r($vals);
eozzy
źródło
Czasami zastanawiam się, co myślał programista, który stworzył implementację PHP XML, gdy projektowano xml_parse_into_struct ...
Anibal Sanchez
7

Metoda używana w akceptowanych atrybutach upuszczania odpowiedzi w przypadku napotkania elementów podrzędnych zawierających tylko węzeł tekstowy. Na przykład:

$xml = '<container><element attribute="123">abcd</element></container>';
print_r(json_decode(json_encode(simplexml_load_string($xml, "SimpleXMLElement", LIBXML_NOCDATA)),1));

Array
(
    [element] => abcd
)

Moje rozwiązanie (i chciałbym podać tutaj kredyt, ponieważ jestem pewien, że zaadaptowałem to z czegoś):

function XMLtoArray($xml) {
    $previous_value = libxml_use_internal_errors(true);
    $dom = new DOMDocument('1.0', 'UTF-8');
    $dom->preserveWhiteSpace = false; 
    $dom->loadXml($xml);
    libxml_use_internal_errors($previous_value);
    if (libxml_get_errors()) {
        return [];
    }
    return DOMtoArray($dom);
}

function DOMtoArray($root) {
    $result = array();

    if ($root->hasAttributes()) {
        $attrs = $root->attributes;
        foreach ($attrs as $attr) {
            $result['@attributes'][$attr->name] = $attr->value;
        }
    }

    if ($root->hasChildNodes()) {
        $children = $root->childNodes;
        if ($children->length == 1) {
            $child = $children->item(0);
            if (in_array($child->nodeType,[XML_TEXT_NODE,XML_CDATA_SECTION_NODE])) {
                $result['_value'] = $child->nodeValue;
                return count($result) == 1
                    ? $result['_value']
                    : $result;
            }

        }
        $groups = array();
        foreach ($children as $child) {
            if (!isset($result[$child->nodeName])) {
                $result[$child->nodeName] = DOMtoArray($child);
            } else {
                if (!isset($groups[$child->nodeName])) {
                    $result[$child->nodeName] = array($result[$child->nodeName]);
                    $groups[$child->nodeName] = 1;
                }
                $result[$child->nodeName][] = DOMtoArray($child);
            }
        }
    }
    return $result;
}

$xml = '
    <aaaa Version="1.0">
       <bbb>
         <cccc>
           <dddd id="123" />
           <eeee name="john" age="24" />
           <ffff type="employee">Supervisor</ffff>
         </cccc>
       </bbb>
    </aaaa>
';
print_r(XMLtoArray($xml));

Array
(
    [aaaa] => Array
        (
            [@attributes] => Array
                (
                    [Version] => 1.0
                )

            [bbb] => Array
                (
                    [cccc] => Array
                        (
                            [dddd] => Array
                                (
                                    [@attributes] => Array
                                        (
                                            [id] => 123
                                        )

                                )

                            [eeee] => Array
                                (
                                    [@attributes] => Array
                                        (
                                            [name] => john
                                            [age] => 24
                                        )

                                )

                            [ffff] => Array
                                (
                                    [@attributes] => Array
                                        (
                                            [type] => employee
                                        )

                                    [_value] => Supervisor
                                )

                        )

                )

        )

)
billynoah
źródło
2

XML do tablicy

Więcej szczegółów Odwiedź https://github.com/sapankumarmohanty/lamp/blob/master/Crate-XML-2-Array

// Konwertuj XML na tablicę i SOAP XML na tablicę

function xml2array($contents, $get_attributes = 1, $priority = 'tag')
    {
        if (!$contents) return array();
        if (!function_exists('xml_parser_create')) {
            // print "'xml_parser_create()' function not found!";
            return array();
        }
        // Get the XML parser of PHP - PHP must have this module for the parser to work
        $parser = xml_parser_create('');
        xml_parser_set_option($parser, XML_OPTION_TARGET_ENCODING, "UTF-8"); // http://minutillo.com/steve/weblog/2004/6/17/php-xml-and-character-encodings-a-tale-of-sadness-rage-and-data-loss
        xml_parser_set_option($parser, XML_OPTION_CASE_FOLDING, 0);
        xml_parser_set_option($parser, XML_OPTION_SKIP_WHITE, 1);
        xml_parse_into_struct($parser, trim($contents) , $xml_values);
        xml_parser_free($parser);
        if (!$xml_values) return; //Hmm...
        // Initializations
        $xml_array = array();
        $parents = array();
        $opened_tags = array();
        $arr = array();
        $current = & $xml_array; //Refference
        // Go through the tags.
        $repeated_tag_index = array(); //Multiple tags with same name will be turned into an array
        foreach($xml_values as $data) {
            unset($attributes, $value); //Remove existing values, or there will be trouble
            // This command will extract these variables into the foreach scope
            // tag(string), type(string), level(int), attributes(array).
            extract($data); //We could use the array by itself, but this cooler.
            $result = array();
            $attributes_data = array();
            if (isset($value)) {
                if ($priority == 'tag') $result = $value;
                else $result['value'] = $value; //Put the value in a assoc array if we are in the 'Attribute' mode
            }
            // Set the attributes too.
            if (isset($attributes) and $get_attributes) {
                foreach($attributes as $attr => $val) {                                   
                                    if ( $attr == 'ResStatus' ) {
                                        $current[$attr][] = $val;
                                    }
                    if ($priority == 'tag') $attributes_data[$attr] = $val;
                    else $result['attr'][$attr] = $val; //Set all the attributes in a array called 'attr'
                }
            }
            // See tag status and do the needed.
                        //echo"<br/> Type:".$type;
            if ($type == "open") { //The starting of the tag '<tag>'
                $parent[$level - 1] = & $current;
                if (!is_array($current) or (!in_array($tag, array_keys($current)))) { //Insert New tag
                    $current[$tag] = $result;
                    if ($attributes_data) $current[$tag . '_attr'] = $attributes_data;
                                        //print_r($current[$tag . '_attr']);
                    $repeated_tag_index[$tag . '_' . $level] = 1;
                    $current = & $current[$tag];
                }
                else { //There was another element with the same tag name
                    if (isset($current[$tag][0])) { //If there is a 0th element it is already an array
                        $current[$tag][$repeated_tag_index[$tag . '_' . $level]] = $result;
                        $repeated_tag_index[$tag . '_' . $level]++;
                    }
                    else { //This section will make the value an array if multiple tags with the same name appear together
                        $current[$tag] = array(
                            $current[$tag],
                            $result
                        ); //This will combine the existing item and the new item together to make an array
                        $repeated_tag_index[$tag . '_' . $level] = 2;
                        if (isset($current[$tag . '_attr'])) { //The attribute of the last(0th) tag must be moved as well
                            $current[$tag]['0_attr'] = $current[$tag . '_attr'];
                            unset($current[$tag . '_attr']);
                        }
                    }
                    $last_item_index = $repeated_tag_index[$tag . '_' . $level] - 1;
                    $current = & $current[$tag][$last_item_index];
                }
            }
            elseif ($type == "complete") { //Tags that ends in 1 line '<tag />'
                // See if the key is already taken.
                if (!isset($current[$tag])) { //New Key
                    $current[$tag] = $result;
                    $repeated_tag_index[$tag . '_' . $level] = 1;
                    if ($priority == 'tag' and $attributes_data) $current[$tag . '_attr'] = $attributes_data;
                }
                else { //If taken, put all things inside a list(array)
                    if (isset($current[$tag][0]) and is_array($current[$tag])) { //If it is already an array...
                        // ...push the new element into that array.
                        $current[$tag][$repeated_tag_index[$tag . '_' . $level]] = $result;
                        if ($priority == 'tag' and $get_attributes and $attributes_data) {
                            $current[$tag][$repeated_tag_index[$tag . '_' . $level] . '_attr'] = $attributes_data;
                        }
                        $repeated_tag_index[$tag . '_' . $level]++;
                    }
                    else { //If it is not an array...
                        $current[$tag] = array(
                            $current[$tag],
                            $result
                        ); //...Make it an array using using the existing value and the new value
                        $repeated_tag_index[$tag . '_' . $level] = 1;
                        if ($priority == 'tag' and $get_attributes) {
                            if (isset($current[$tag . '_attr'])) { //The attribute of the last(0th) tag must be moved as well
                                $current[$tag]['0_attr'] = $current[$tag . '_attr'];
                                unset($current[$tag . '_attr']);
                            }
                            if ($attributes_data) {
                                $current[$tag][$repeated_tag_index[$tag . '_' . $level] . '_attr'] = $attributes_data;
                            }
                        }
                        $repeated_tag_index[$tag . '_' . $level]++; //0 and 1 index is already taken
                    }
                }
            }
            elseif ($type == 'close') { //End of tag '</tag>'
                $current = & $parent[$level - 1];
            }
        }
        return ($xml_array);
    }
    
    // Let's call the this above function xml2array
    
    xml2array($xmlContent, $get_attributes = 3, $priority = 'tag'); // it will work 100% if not ping me @skype: sapan.mohannty
    
//  Enjoy coding
htngapi
źródło
0

Podobało mi się to pytanie i niektóre odpowiedzi były dla mnie pomocne, ale muszę przekonwertować xml na jedną tablicę dominacji, więc opublikuję moje rozwiązanie, może ktoś będzie go później potrzebować:

<?php
$xml = json_decode(json_encode((array)simplexml_load_string($xml)),1);
$finalItem = getChild($xml);
var_dump($finalItem);

function getChild($xml, $finalItem = []){
    foreach($xml as $key=>$value){
        if(!is_array($value)){
            $finalItem[$key] = $value;
        }else{
            $finalItem = getChild($value, $finalItem);
        }
    }
    return $finalItem;
}
?>  
Mohammad Alabed
źródło