Cómo dividir cadenas en Ruby

A menos que la entrada del usuario sea una sola palabra o número, esa entrada deberá ser división o convertido en una lista de cadenas o números.

Por ejemplo, si un programa le pide su nombre completo, incluida la inicial del segundo nombre, primero deberá dividir esa entrada en tres instrumentos de cuerda antes de que pueda funcionar con su nombre, segundo nombre y apellido individuales. Esto se logra utilizando el Cadena # dividida método.

Cómo funciona String # split

En su forma más básica, Cadena # dividida toma un solo argumento: el delimitador de campo como una cadena. Este delimitador se eliminará de la salida y se devolverá una matriz de cadenas divididas en el delimitador.

Entonces, en el siguiente ejemplo, suponiendo que el usuario ingrese su nombre correctamente, debería recibir un elemento de tres elementos Formación De la división.

#! / usr / bin / env ruby
print "¿Cuál es tu nombre completo? "
full_name = gets.chomp
nombre = full_name.split ('')
pone "Su nombre es # {name.first}"
pone "Su apellido es # {name.last}"

instagram viewer

Si ejecutamos este programa e ingresamos un nombre, obtendremos algunos resultados esperados. Además, tenga en cuenta que nombre primero y apellido son coincidencias los nombre la variable será un Formación, y esas dos llamadas a métodos serán equivalentes a nombre [0] y nombre [-1] respectivamente.

$ ruby split.rb
¿Cuál es su nombre completo? Michael C. Morin
Tu nombre es michael
Tu apellido es Morin

Sin embargo, Cadena # dividida es un poco más inteligente de lo que piensas. Si el argumento para Cadena # dividida es una cadena, de hecho lo usa como delimitador, pero si el argumento es una cadena con un solo espacio (como usamos), luego infiere que desea dividir en cualquier cantidad de espacio en blanco y que también desea eliminar cualquier espacio en blanco inicial.

Entonces, si tuviéramos que darle una entrada ligeramente malformada como

Michael C. Morin

(con espacios adicionales), luego Cadena # dividida aún haría lo que se espera. Sin embargo, ese es el único caso especial cuando pasa un Cuerda como el primer argumento Delimitadores de expresión regular

También puede pasar una expresión regular como primer argumento. Aquí, Cadena # dividida se vuelve un poco más flexible. También podemos hacer que nuestro pequeño código de división de nombres sea un poco más inteligente.

No queremos el período al final de la inicial del segundo nombre. Sabemos que es una inicial del segundo nombre, y la base de datos no querrá un punto allí, por lo que podemos eliminarla mientras nos dividimos. Cuando Cadena # dividida coincide con una expresión regular, hace exactamente lo mismo que si hubiera coincidido con un delimitador de cadena: lo saca de la salida y lo divide en ese punto.

Entonces, podemos evolucionar un poco nuestro ejemplo:

$ cat split.rb
#! / usr / bin / env ruby
print "¿Cuál es tu nombre completo? "
full_name = gets.chomp
name = full_name.split (/ \.? \ s + /)
pone "Su nombre es # {name.first}"
pone "Tu inicial del segundo nombre es # {nombre [1]}"
pone "Su apellido es # {name.last}"

Separador de registro predeterminado

Rubí no es realmente grande en "variables especiales" que puede encontrar en idiomas como Perl, pero Cadena # dividida utiliza uno que necesita tener en cuenta. Esta es la variable de separador de registro predeterminada, también conocida como $;.

Es global, algo que no se ve con frecuencia en Ruby, por lo que si lo cambia, podría afectar a otras partes del código, solo asegúrese de volver a cambiarlo cuando haya terminado.

Sin embargo, todo lo que hace esta variable es actuar como el valor predeterminado para el primer argumento para Cadena # dividida. Por defecto, esta variable parece estar configurada en nulo. Sin embargo, si Cadena # divididaEl primer argumento es nulo, lo reemplazará con una sola cadena de espacio.

Delimitadores de longitud cero

Si el delimitador pasó a Cadena # dividida es una cadena de longitud cero o una expresión regular, entonces Cadena # dividida actuará un poco diferente. No eliminará nada de la cadena original y se dividirá en cada carácter. Básicamente, esto convierte la cadena en una matriz de igual longitud que contiene solo cadenas de un carácter, una para cada carácter de la cadena.

Esto puede ser útil para iterar sobre la cadena y se utilizó en pre-1.9.xy pre-1.8.7 (que incluía un Número de características desde 1.9.x) para iterar sobre los caracteres en una cadena sin preocuparse por la ruptura multibyte Caracteres Unicode. Sin embargo, si lo que realmente quiere hacer es iterar sobre una cadena y está usando 1.8.7 o 1.9.x, probablemente debería usar Cadena # each_char en lugar.

#! / usr / bin / env ruby
str = "¡Ella me convirtió en un tritón!"
str.split (''). cada do | c |
pone c
final

Limitar la longitud de la matriz devuelta

Volviendo a nuestro ejemplo de análisis de nombre, ¿qué pasa si alguien tiene un espacio en su apellido? Por ejemplo, los apellidos holandeses a menudo pueden comenzar con "van" (que significa "de" o "de").

Solo queremos realmente un elemento 3 formación, entonces podemos usar el segundo argumento para Cadena # dividida que hasta ahora hemos ignorado. Se espera que el segundo argumento sea un Fixnum. Si este argumento es positivo, a lo sumo, se completarán muchos elementos en la matriz. Entonces, en nuestro caso, nos gustaría pasar 3 para este argumento.

#! / usr / bin / env ruby
print "¿Cuál es tu nombre completo? "
full_name = gets.chomp
name = full_name.split (/ \.? \ s + /, 3)
pone "Su nombre es # {name.first}"
pone "Tu inicial del segundo nombre es # {nombre [1]}"
pone "Su apellido es # {name.last}"

Si ejecutamos esto nuevamente y le damos un nombre holandés, actuará como se esperaba.

$ ruby split.rb
¿Cuál es su nombre completo? Vincent Willem van Gogh
Tu nombre es Vincent
Tu inicial del segundo nombre es Willem
Tu apellido es van Gogh

Sin embargo, si este argumento es negativo (cualquier número negativo), entonces no habrá límite en el número de los elementos en la matriz de salida y los delimitadores finales aparecerán como cadenas de longitud cero al final de formación.

Esto se demuestra en este fragmento de IRB:

: 001> "this, is, a, test" .split (',', -1)
=> ["esto", "es", "a", "prueba", "", "", "", ""]