using System; using System.Diagnostics; using System.IO; using Implab.Automaton; using Implab.Automaton.RegularExpressions; using System.Linq; using Implab.Components; namespace Implab.Formats.JSON { /// /// internal /// public struct JSONParserContext { public string memberName; public JSONElementContext elementContext; } /// /// Pull парсер JSON данных. /// /// /// Следует отметить отдельную интерпретацию свойства , /// оно означает текущий уровень вложенности объектов, однако закрывающий /// элемент объекта и массива имеет уровень меньше, чем сам объект. /// /// { // Level = 1 /// "name" : "Peter", // Level = 1 /// "address" : { // Level = 2 /// city : "Stern" // Level = 2 /// } // Level = 1 /// } // Level = 0 /// /// public class JSONParser : Disposable { enum MemberContext { MemberName, MemberValue } #region Parser rules struct ParserContext { readonly int[,] m_dfa; int m_state; readonly JSONElementContext m_elementContext; public ParserContext(int[,] dfa, int state, JSONElementContext context) { m_dfa = dfa; m_state = state; m_elementContext = context; } public bool Move(JsonTokenType token) { var next = m_dfa[m_state, token]; if (next == AutomatonConst.UNREACHABLE_STATE) return false; m_state = next; } public JSONElementContext ElementContext { get { return m_elementContext; } } } static JSONParser() { var valueExpression = Token(JsonTokenType.BeginArray, JsonTokenType.BeginObject, JsonTokenType.Literal, JsonTokenType.Number, JsonTokenType.String); var memberExpression = Token(JsonTokenType.String).Cat(Token(JsonTokenType.NameSeparator)).Cat(valueExpression); var objectExpression = memberExpression .Cat( Token(JsonTokenType.ValueSeparator) .Cat(memberExpression) .EClosure() ) .Optional() .Cat(Token(JsonTokenType.EndObject)) .End(); var arrayExpression = valueExpression .Cat( Token(JsonTokenType.ValueSeparator) .Cat(valueExpression) .EClosure() ) .Optional() .Cat(Token(JsonTokenType.EndArray)) .End(); var jsonExpression = valueExpression.End(); _jsonDFA = CreateParserContext(jsonExpression, JSONElementContext.None); _objectDFA = CreateParserContext(objectExpression, JSONElementContext.Object); _arrayDFA = CreateParserContext(arrayExpression, JSONElementContext.Array); } static Token Token(params JsonTokenType[] input) { return Token.New( input.Select(t => (int)t).ToArray() ); } static ParserContext CreateParserContext(Token expr, JSONElementContext context) { var dfa = new DFATable(); var builder = new RegularExpressionVisitor(dfa); expr.Accept(builder); builder.BuildDFA(); return new ParserContext(dfa.CreateTransitionTable(), dfa.InitialState, context); } #endregion JSONScanner m_scanner; MemberContext m_memberContext; JSONElementType m_elementType; object m_elementValue; /// /// Создает новый парсер на основе строки, содержащей JSON /// /// public JSONParser(string text) : base(_jsonDFA, INITIAL_STATE, new JSONParserContext { elementContext = JSONElementContext.None, memberName = String.Empty }) { Safe.ArgumentNotEmpty(text, "text"); m_scanner = new JSONScanner(); m_scanner.Feed(text.ToCharArray()); } /// /// Создает новый экземпляр парсера, на основе текстового потока. /// /// Текстовый поток. public JSONParser(TextReader reader) : base(_jsonDFA, INITIAL_STATE, new JSONParserContext { elementContext = JSONElementContext.None, memberName = String.Empty }) { Safe.ArgumentNotNull(reader, "reader"); m_scanner = new JSONScanner(); m_scanner.Feed(reader, dispose); } /// /// Тип текущего элемента на котором стоит парсер. /// public JSONElementType ElementType { get { return m_elementType; } } /// /// Имя элемента - имя свойства родительского контейнера. Для элементов массивов и корневого всегда /// пустая строка. /// public string ElementName { get { return m_context.info.memberName; } } /// /// Значение элемента. Только для элементов типа , для остальных null /// public object ElementValue { get { return m_elementValue; } } /// /// Читает слеюудущий объект из потока /// /// true - операция чтения прошла успешно, false - конец данных public bool Read() { if (m_context.current == UNREACHEBLE_STATE) throw new InvalidOperationException("The parser is in invalid state"); object tokenValue; JsonTokenType tokenType; m_context.info.memberName = String.Empty; while (m_scanner.ReadToken(out tokenValue, out tokenType)) { Move((int)tokenType); if (m_context.current == UNREACHEBLE_STATE) UnexpectedToken(tokenValue, tokenType); switch (tokenType) { case JsonTokenType.BeginObject: Switch( _objectDFA, INITIAL_STATE, new JSONParserContext { memberName = m_context.info.memberName, elementContext = JSONElementContext.Object } ); m_elementValue = null; m_memberContext = MemberContext.MemberName; m_elementType = JSONElementType.BeginObject; return true; case JsonTokenType.EndObject: Restore(); m_elementValue = null; m_elementType = JSONElementType.EndObject; return true; case JsonTokenType.BeginArray: Switch( _arrayDFA, INITIAL_STATE, new JSONParserContext { memberName = m_context.info.memberName, elementContext = JSONElementContext.Array } ); m_elementValue = null; m_memberContext = MemberContext.MemberValue; m_elementType = JSONElementType.BeginArray; return true; case JsonTokenType.EndArray: Restore(); m_elementValue = null; m_elementType = JSONElementType.EndArray; return true; case JsonTokenType.String: if (m_memberContext == MemberContext.MemberName) { m_context.info.memberName = (string)tokenValue; break; } m_elementType = JSONElementType.Value; m_elementValue = tokenValue; return true; case JsonTokenType.Number: m_elementType = JSONElementType.Value; m_elementValue = tokenValue; return true; case JsonTokenType.Literal: m_elementType = JSONElementType.Value; m_elementValue = ParseLiteral((string)tokenValue); return true; case JsonTokenType.NameSeparator: m_memberContext = MemberContext.MemberValue; break; case JsonTokenType.ValueSeparator: m_memberContext = m_context.info.elementContext == JSONElementContext.Object ? MemberContext.MemberName : MemberContext.MemberValue; break; default: UnexpectedToken(tokenValue, tokenType); break; } } if (m_context.info.elementContext != JSONElementContext.None) throw new ParserException("Unexpedted end of data"); return false; } object ParseLiteral(string literal) { switch (literal) { case "null": return null; case "false": return false; case "true": return true; default: UnexpectedToken(literal, JsonTokenType.Literal); return null; // avoid compliler error } } void UnexpectedToken(object value, JsonTokenType tokenType) { throw new ParserException(String.Format("Unexpected token {0}: '{1}'", tokenType, value)); } /// /// Признак конца потока /// public bool EOF { get { return m_scanner.EOF; } } protected override void Dispose(bool disposing) { if (disposing) { m_scanner.Dispose(); } } /// /// Переходит в конец текущего объекта. /// public void SeekElementEnd() { var level = Level - 1; Debug.Assert(level >= 0); while (Level != level) Read(); } } }